CN104111970A - 统计页面平均停留时间、确定页面用户黏性的方法和装置 - Google Patents

统计页面平均停留时间、确定页面用户黏性的方法和装置 Download PDF

Info

Publication number
CN104111970A
CN104111970A CN201410250438.5A CN201410250438A CN104111970A CN 104111970 A CN104111970 A CN 104111970A CN 201410250438 A CN201410250438 A CN 201410250438A CN 104111970 A CN104111970 A CN 104111970A
Authority
CN
China
Prior art keywords
residence time
page
proportion
default
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410250438.5A
Other languages
English (en)
Other versions
CN104111970B (zh
Inventor
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weimeng Chuangke Network Technology China Co Ltd
Original Assignee
Weimeng Chuangke Network Technology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weimeng Chuangke Network Technology China Co Ltd filed Critical Weimeng Chuangke Network Technology China Co Ltd
Priority to CN201410250438.5A priority Critical patent/CN104111970B/zh
Publication of CN104111970A publication Critical patent/CN104111970A/zh
Application granted granted Critical
Publication of CN104111970B publication Critical patent/CN104111970B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Abstract

本发明公开了一种统计页面平均停留时间、确定网页用户黏性的方法和装置,统计页面平均停留时间的方法包括:对于网站中待统计的页面,获取网站服务器记录的该页面的停留时间;其中,大于预设会话时间阈值的该页面的停留时间以空值表示;计算出值为空值的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重;根据获取的非空值的该页面的停留时间,计算出该页面的平均停留时间的基础值;若判定计算出的比重大于预设比重阈值,则根据该比重与预设会话时间阈值确定该页面的平均停留时间;否则将计算出的该页面的平均停留时间的基础值作为该页面的平均停留时间。应用本发明可以提高计算网站页面的平均停留时间的准确性。

Description

统计页面平均停留时间、确定页面用户黏性的方法和装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种统计页面平均停留时间、确定页面用户黏性统计方法和装置。
背景技术
通常,一个网站中包含多个页面,网站运营人员可以在网站页面上发布想要公开的资讯,或者利用网站来提供相关的网络服务。人们可以通过网页浏览器来访问网站,获取需要的资讯或者享受网络服务。
网站页面的停留时间通俗的讲就是用户在浏览这个网站页面时所花费的时间,在一定程度上反映了该网站页面对用户的黏性。因此,网站运营人员通常统计出一个网站页面的平均停留时间,将其作为衡量网站的性能的一个指标,来了解网站页面的内容质量,并为网站运营提供决策支持。
在实际应用中,网络服务器对于网站的一个页面,将用户访问该页面的时间(t1)和访问下一个页面的时间(t2)的差值(t2-t1)作为用户浏览该页面的时间,即该页面的停留时间。基于此,现有技术的计算网站的网页平均停留时间的方法是:统计出该页面的每次访问的停留时间后,将该页面的每次访问的停留时间之和与该页面的访问次数的比值,作为该页面的平均停留时间。
然而,本发明的发明人发现,根据现有方法计算的网站页面的平均停留时间不够准确;并进一步分析后发现原因在于:用户行为存在较大差异,比如用户访问一个页面后,可能因为有事离开长时间未关闭该页面,而当该页面中带有视频或者难以理解的文字等时,用户也可能是因为在一直浏览该页面(观看该页面的视频或者一直致力于理解其中的文字)而长时间未关闭该页面,现有方法无法得知用户长时间未关闭页面是因为用户有事离开还是用户一直在浏览该页面,在计算网站页面的平均停留时间时,对于上述长时间未关闭网页的情况并不进行区分,使得计算出的网站页面的平均停留时间不够准确。
发明内容
针对上述现有技术存在的缺陷,本发明实施例提供了一种统计页面平均停留时间、确定页面用户黏性的方法和装置,用以提高网站页面平均停留时间确定的准确性,并确定用户对页面的黏性。
本发明实施例提供了一种统计页面平均停留时间的方法,包括:
对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值null表示;
计算出值为null的所述页面的停留时间的个数在获取的所述页面的停留时间的个数中所占的比重;并根据获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值;
若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。
较佳地,所述若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间,具体包括:
若判定所述比重大于预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值;若是,则将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;否则,将所述比重与预设会话时间阈值相乘,得到所述页面的平均停留时间。
较佳地,所述根据获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值,具体包括:
将获取的非null值的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。
其中,所述预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),其中,n为获取的所述页面的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整;以及
所述选取排序在预设的排序区间内的所述页面的停留时间,具体包括:
选取排序在第INT(m1×n)位与第INT(m2×n)位之间的所述页面的停留时间。
本发明实施例还提供了一种确定页面用户黏性的方法,包括:
对于网站中待统计的页面,根据上述的统计页面平均停留时间的方法统计出该页面的平均停留时间;
根据统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。
本发明实施例还提供了一种统计页面平均停留时间的装置,包括:
停留时间获取模块,用户对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值null表示;
比重计算模块,用于从所述停留时间获取模块获取的所述页面的停留时间中统计出值为null的所述页面的停留时间的个数,计算该个数在所述停留时间获取模块获取的所述页面的停留时间的个数中所占的比重;
基础值计算模块,用于根据所述停留时间获取模块获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值;
平均停留时间计算模块,用于若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。
较佳地,所述平均停留时间计算模块具体包括:
判断单元,用于若判定所述比重大于所述预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值,若是,则发送第一计算通知,否则发送第二计算通知;若判断所述比重小于等于所述预设比重阈值,则发送第三计算通知;
平均停留时间计算单元,用于接收到第一计算通知后,将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;接收到第二计算通知后,将所述比重与预设会话时间阈值相乘,得到所述页面的平均停留时间;以及接收到第三计算通知后,将所述基础值作为所述页面的平均停留时间。
较佳地,所述基础值计算模块具体用于将所述停留时间获取模块获取的非null的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。
其中,所述基础值计算模块中预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),其中,n为获取的所述页面的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整。
本发明实施例还提供了一种确定页面用户黏性的装置,包括:
上述的网站页面平均停留时间统计装置;以及
网页用户黏性确定模块,用于对于网站中待统计的页面,根据所述网站页面平均停留时间统计装置统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。
本发明的技术方案中,对于网站的待统计的页面,获取网络服务器中记录的该页面的若干个停留时间后,计算出值为null的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重,根据该比重与预设比重阈值的大小关系,采用不同的方式来计算该页面的平均停留时间,即当该比重大于预设比重阈值时,根据该比重与预设会话时间阈值的乘积来计算该页面的平均停留时间,当该比重小于等于预设比重阈值时,根据该页面的平均停留时间的基础值计算该页面的平均停留时间。本发明考虑了网络服务器记录的值为null的页面的停留时间对页面的平均停留时间的影响,提高了页面的平均停留时间的的准确性。而且,基于统计出的页面的平均停留时间,可以确定出用户对页面的黏性等级,进而便于网站运营人员作出运营决策等。
附图说明
图1为本发明实施例的统计页面平均停留时间的方法流程图;
图2为本发明实施例的统计页面平均停留时间的装置的内部结构框图;
图3为本发明实施例的确定页面用户黏性的装置的内部结构框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举出优选实施例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以实现本发明的这些方面。
本申请使用的“模块”、“系统”等术语旨在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限于:处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。一个或多个模块可以位于执行中的一个进程和/或线程内。
本发明的发明人发现,网络服务器在确定用户在一个页面的停留时间大于预设会话时间阈值后,便会将用户在该页面的停留时间记录为空值(null),因此并不能对用户离开和一直在浏览网页而长时间未关闭页面的情况进行区分。而且,本发明的发明人还发现,在网络服务器记录的一个页面的停留时间中,若值为null的该页面的停留时间的个数在该页面的停留时间的总数中所占的比重大于一定值,比如20%,则通常认为该页面中包含诸如视频类的内容。因此,本发明的发明人考虑到,对于网站的一个页面,可以将值为null的该页面的停留时间的个数在该页面的停留时间的总数中所占的比重,作为一个影响因素对该页面的平均停留时间进行统计,以使得计算出的平均停留时间更为准确。
基于此,本发明的技术方案中,对于网站的一个页面,获取网络服务器中记录的该页面的若干个停留时间,计算出值为null的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重,并根据获取的非null值(值不为null)的该页面的停留时间,计算出该页面的平均停留时间的基础值;之后,根据计算出的比重与预设比重阈值的大小关系,计算出该页面的平均停留时间。从而,提高页面的平均停留时间的准确性。
下面结合附图详细说明本发明的技术方案。本发明实施例提供的统计网页平均停留时间的方法的流程,如图1所示,具体包括如下步骤:
S101:对于网站中待统计的页面(记为页面A),获取网站服务器记录的页面A的若干个停留时间。
具体地,网站服务器中记录有网站的页面的停留时间,对于一个待统计平均停留时间的页面A,获取网站服务器记录的页面A的若干个停留时间,具体可以是获取设定时间段内或者设定数量的网站服务器记录的页面A的停留时间。其中,大于预设会话时间阈值的页面A的停留时间以null(空值)表示。通常,预设会话时间阈值由本领域技术人员根据实际需求或经验进行设定,具体可以是20分钟、30分钟。
例如,表1示出了获取的页面A的10个停留时间,其中预设会话时间阈值为30分钟(1800秒)。如表1所示,针对一次访问的页面A的停留时间,也就是针对该次访问,将访问下一个页面的时间(向网络服务器发送下一个页面的请求的时间)减去访问页面A的时间(向网络服务器发送页面A的请求的时间),便可得到针对该次访问的页面A的停留时间。
表1
S102:计算出值为null的页面A的停留时间的个数在获取的页面A的停留时间的个数中所占的比重,作为页面A的停留时间的null值比重。
例如,若获取的页面A的停留时间如表1所示,其中值为null的停留时间的个数为2,则计算出的值为null的页面A的停留时间的个数在获取的页面A的停留时间的个数中所占的比重为20%。
S103:根据获取的非null值的页面A的停留时间,计算出页面A的平均停留时间的基础值。
具体地,可根据现有技术的方法,将获取的非null值的页面A的停留时间的平均值,作为页面A的平均停留时间的基础值。
较优地,还可以将获取的非null值(即值不为null)的页面A的停留时间进行排序,选取排序在预设的排序区间内的页面A的停留时间后,计算出选取出的页面A的停留时间的平均值,作为页面A的平均停留时间的基础值。其中,预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),n为获取的页面A的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整。这样,选取排序在预设排序区间内的页面A的停留时间也就是选取排序在第INT(m1×n)位与第INT(m2×n)位之间的页面A的停留时间。m1和m2可以由本领域技术人员进行设定,m1具体可以为20%,m2具体可以为80%。例如,获取的非null值的页面A的停留时间为101个,则可确定出预设的排序区间的端点为20和80,即选取出排序第20位和第80位之间的页面A的停留时间。
这种将排序靠前和靠后的部分停留时间排除掉的方式,可以排除一些因用户行为差异导致的干扰数据,尤其是该方式很好地排除了那些手误打开网站页面后,又立即关闭该页面的情况,较好地提高了页面平均停留时间计算的准确性。
例如,表2是对上述表1所示的非null值的页面A的停留时间进行排序后的结果,根据该方式选取出排序在第3位与第6位之间的页面A的停留时间,即30s、41s、50s、57s,这样计算出的页面A的平均停留时间的基础值为44.5s。
表2
其中,上述步骤S102和S103并没有严格的执行顺序,也就是可以先执行S102,也可以先执行S103,还可以并行执行S102和S103。
S104:判断计算出的页面A的停留时间的null值比重是否大于预设比重阈值;若是,则执行步骤S105;否则,执行步骤S108。
若在本步骤中,若判定计算出的页面A的停留时间的null值比重大于预设比重阈值,则可根据计算出的页面A的停留时间的null值比重与预设会话时间阈值确定页面A的平均停留时间,具体如下述步骤S105~S107所示;若判定计算出的页面A的停留时间的null值比重小于等于预设比重阈值,则可将计算出的页面A的平均停留时间的基础值作为页面A的平均停留时间,具体如下述步骤S108所示。其中,预设比重阈值具体由本领域技术人员根据实际需求或经验进行设定,例如,预设比重阈值可以设定为20%。
S105:判断计算出的页面A的平均停留时间的基础值是否大于预设停留时间阈值;若是,则执行步骤S106;否则,执行步骤S107。
具体地,若判定页面A的停留时间的null值比重大于预设比重阈值,则在本步骤中判断计算出的页面A的平均停留时间的基础值是否大于预设停留时间阈值。其中,预设停留时间阈值由本领域技术人员进行设定,具体可以是90s。
S106:将页面A的停留时间的null值比重与预设会话时间阈值相乘后,与页面A的平均停留时间的基础值相加,将得到的和作为页面A的平均停留时间。
具体地,若页面A的停留时间的null值比重大于预设比重阈值,页面A的平均停留时间的基础值大于预设停留时间阈值,则计算出页面A的停留时间的null值比重与预设会话时间阈值的乘积,将计算出的乘积与页面A的平均停留时间的基础值的和作为页面A的平均停留时间。通常,包含有诸如视频类内容的页面的平均停留时间较长,这样,也就容易出现因用户一直浏览该页面而使得该页面的停留时间中大于预设会话时间阈值的个数较多,即该页面的停留时间的null值比重较大,且此时该页面的平均停留时间的基础值也会较大。因此,当页面A的停留时间的null值比重较大,且页面A的平均停留时间的基础值也较大时,表明页面A包含诸如视频类内容的可能性很大,将页面A的停留时间的null值比重与预设会话时间阈值相乘后,与页面A的平均停留时间的基础值相加,将得到的和作为页面A的平均停留时间。
例如,若预设停留时间阈值为90s,预设比重阈值为20%,统计出的页面A的停留时间的null值比重为20%,计算出的页面A的平均停留时间为120秒,预设会话时间阈值为30分钟(即1800秒),则页面A的平均停留时间=120+20%×1800=480秒。
S107:将页面A的停留时间的null值比重与预设会话时间阈值相乘后,将得到的乘积作为页面A的平均停留时间。
具体地,若页面A的停留时间的null值比重大于预设比重阈值,页面A的平均停留时间的基础值小于等于预设停留时间阈值,则计算出页面A的停留时间的null值比重与预设会话时间阈值的乘积,将计算出的乘积作为页面A的平均停留时间。如前所述,通常包含有诸如视频类内容的页面的平均停留时间较长,这样,也就容易出现因用户一直浏览该页面而使得该页面的停留时间中大于预设会话时间阈值的个数较多,即该页面的停留时间的null值比重较大,且此时该页面的平均停留时间的基础值也会较大。若当页面A的停留时间的null值比重较大,反而页面A的平均停留时间的基础值较小,表明获取的非null值的页面A的停留时间中,可能很多是因用户手误打开页面A后,又关闭页面A的情况,为保证计算页面A的平均停留时间的准确性,可将这部分数据去除掉,也就是将页面A的停留时间的null值比重与预设会话时间阈值的乘积作为页面A的平均停留时间。
例如,若预设停留时间阈值为90s,预设比重阈值为20%,统计出的页面A的停留时间的null值比重为40%,计算出的页面A的平均停留时间为10秒,预设会话时间阈值为30分钟(即1800秒),则页面A的平均停留时间=40%×1800=560秒。
基于上述步骤S105~S107,将页面A的停留时间的null值比重与页面A的平均停留时间的基础值结合起来,进行页面A的平均停留时间的确定可以使得确定出的平均停留时间更为准确。
S108:将计算出的页面A的平均停留时间的基础值作为页面A的平均停留时间。
具体地,若计算出的页面A的停留时间的null值比重小于等于预设比重阈值,则表面出现的这些小比例的值为null的页面A的停留时间,可能是因一些用户有事离开而长时间为关闭网页,是计算页面A的平均停留时间时的干扰数据,也就是说,页面A的停留时间的null值比重较小时,表明这些null值的出现是由于一些用户打开页面A后离开未关闭页面引起的,而不是用户一直在浏览页面A的内容。因此,若计算出的页面A的停留时间的null值比重小于等于预设比重阈值,则将计算出的页面A的平均停留时间的基础值作为页面A的平均停留时间。
基于上述的统计页面平均停留时间的方法,本发明实施例的确定页面用户黏性的方法,具体包括:对于网站中待统计的页面,根据上述的统计页面平均停留时间的方法统计出该页面的平均停留时间;根据统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级,即该页面的用户黏性等级。其中,预设的平均停留时间与黏性等级的对应关系,具体由本领域技术人员根据实际需求来设定。通常,对于网站中的一个页面,该页面的平均停留时间可以反映出用户对该页面的黏性,该页面的平均停留时间越长,用户对该页面的黏性越大、黏性等级越高。
基于上述的统计页面平均停留时间的方法,本发明实施例提供的统计页面平均停留时间的装置的内部结构框图,如图2所示,包括:停留时间获取模块201、比重计算模块202、基础值计算模块203、平均停留时间计算模块204。
其中,停留时间获取模块201用户对于网站中待统计的页面,获取网站服务器记录的该页面的若干个停留时间;其中,大于预设会话时间阈值的该页面的停留时间以空值null表示。
比重计算模块202用于从停留时间获取模块201获取的页面的停留时间中统计出值为null的该页面的停留时间的个数,计算该个数在停留时间获取模块201获取的页面的停留时间的个数中所占的比重。
基础值计算模块203用于根据停留时间获取模块201获取的非null值的待统计的页面的停留时间,计算出该页面的平均停留时间的基础值。具体地,基础值计算模块203具体用于将停留时间获取模块201获取的非null的待统计的页面的停留时间进行排序,选取排序在预设排序区间内的该页面的停留时间后,计算出选取出的该页面的停留时间的平均值,作为该页面的平均停留时间的基础值。其中,预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),其中,n为获取的所述页面的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整。
平均停留时间计算模块204用于若判定比重计算模块202计算出的比重大于预设比重阈值,则根据比重计算模块202计算出的比重与预设会话时间阈值确定待统计的页面的平均停留时间;否则,将基础值计算模块203计算出的基础值作为待统计的页面的平均停留时间。
进一步,平均停留时间计算模块204具体包括:判断单元211和平均停留时间计算单元212。
其中,判断单元211用于若判定比重计算模块202计算出的比重大于预设比重阈值,则进一步判断基础值计算模块203计算出的基础值是否大于预设停留时间阈值,若是,则发送第一计算通知,否则发送第二计算通知;若判断比重计算模块202计算出的比重小于等于预设比重阈值,则发送第三计算通知。
平均停留时间计算单元212用于接收到判断单元211发送的第一计算通知后,将比重计算模块202计算出的比重与预设会话时间阈值相乘后与基础值计算模块203计算出的基础值相加,得到待统计的页面的平均停留时间;以及接收到判断单元211发送的第二计算通知后,将比重计算模块202计算出的比重与预设会话时间阈值相乘,得到待统计的页面的平均停留时间;以及接收到第三计算通知后,将基础值计算模块203计算出的基础值作为待统计的页面的平均停留时间。
其中,上述的预设比重阈值具体为20%;预设会话时间阈值具体为30分钟;预设停留时间阈值具体为90秒。
基于上述的确定页面用户黏性的方法,本发明实施例提供的确定页面用户黏性的装置的内部结构框图,如图3所示,具体包括:上述的统计页面平均停留时间的装置的停留时间获取模块201、比重计算模块202、基础值计算模块203、平均停留时间计算模块204,以及网页用户黏性确定模块301。
其中,网页用户黏性确定模块301用于对于网站中待统计的页面,根据网站页面平均停留时间统计装置统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。
本发明的技术方案中,对于网站的待统计的页面,获取网络服务器中记录的该页面的若干个停留时间后,计算出值为null的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重,根据该比重与预设比重阈值的大小关系,采用不同的方式来计算该页面的平均停留时间,即当该比重大于预设比重阈值时,根据该比重与预设会话时间阈值来确定该页面的平均停留时间,当该比重小于等于预设比重阈值时,将该页面的平均停留时间的基础值作为该页面的平均停留时间。本发明考虑了网络服务器记录的值为null的页面的停留时间对页面的平均停留时间的影响,提高了页面的平均停留时间的的准确性。而且,基于统计出的页面的平均停留时间,可以确定出用户对页面的黏性等级,进而便于网站运营人员作出运营决策等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读取存储介质中,如:ROM/RAM、磁碟、光盘等。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种统计页面平均停留时间的方法,其特征在于,包括:
对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值null表示;
计算出值为null的所述页面的停留时间的个数在获取的所述页面的停留时间的个数中所占的比重;并根据获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值;
若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。
2.如权利要求1所述的方法,其特征在于,所述若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间,具体包括:
若判定所述比重大于预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值;若是,则将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;否则,将所述比重与预设会话时间阈值相乘,得到所述页面的平均停留时间。
3.如权利要求1或2所述的方法,其特征在于,所述根据获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值,具体包括:
将获取的非null值的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。
4.如权利要求3所述的方法,其特征在于,所述预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),其中,n为获取的所述页面的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整;以及
所述选取排序在预设的排序区间内的所述页面的停留时间,具体包括:
选取排序在第INT(m1×n)位与第INT(m2×n)位之间的所述页面的停留时间。
5.一种确定页面用户黏性的方法,其特征在于,包括:
对于网站中待统计的页面,根据如权利要求1-4任一所述的方法统计出该页面的平均停留时间;
根据统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。
6.一种统计页面平均停留时间的装置,其特征在于,包括:
停留时间获取模块,用户对于网站中待统计的页面,获取网站服务器记录的所述页面的若干个停留时间;其中,大于预设会话时间阈值的所述页面的停留时间以空值null表示;
比重计算模块,用于从所述停留时间获取模块获取的所述页面的停留时间中统计出值为null的所述页面的停留时间的个数,计算该个数在所述停留时间获取模块获取的所述页面的停留时间的个数中所占的比重;
基础值计算模块,用于根据所述停留时间获取模块获取的非null值的所述页面的停留时间,计算出所述页面的平均停留时间的基础值;
平均停留时间计算模块,用于若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为所述页面的平均停留时间。
7.如权利要求6所述的装置,其特征在于,所述平均停留时间计算模块具体包括:
判断单元,用于若判定所述比重大于所述预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值,若是,则发送第一计算通知,否则发送第二计算通知;若判断所述比重小于等于所述预设比重阈值,则发送第三计算通知;
平均停留时间计算单元,用于接收到第一计算通知后,将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到所述页面的平均停留时间;接收到第二计算通知后,将所述比重与预设会话时间阈值相乘,得到所述页面的平均停留时间;以及接收到第三计算通知后,将所述基础值作为所述页面的平均停留时间。
8.如权利要求6或7所述的装置,其特征在于,
所述基础值计算模块具体用于将所述停留时间获取模块获取的非null的所述页面的停留时间进行排序,选取排序在预设的排序区间内的所述页面的停留时间后,计算出选取出的所述页面的停留时间的平均值,作为所述页面的平均停留时间的基础值。
9.如权利要求8所述的装置,其特征在于,所述基础值计算模块中预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),其中,n为获取的所述页面的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整。
10.一种确定页面用户黏性的装置,其特征在于,包括:
如权利要求6-9任一所述的网站页面平均停留时间统计装置;以及
网页用户黏性确定模块,用于对于网站中待统计的页面,根据所述网站页面平均停留时间统计装置统计出的该页面的平均停留时间、以及预设的平均停留时间与黏性等级的对应关系,确定用户对该页面的黏性等级。
CN201410250438.5A 2014-06-06 2014-06-06 统计页面平均停留时间、确定页面用户黏性的方法和装置 Active CN104111970B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410250438.5A CN104111970B (zh) 2014-06-06 2014-06-06 统计页面平均停留时间、确定页面用户黏性的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410250438.5A CN104111970B (zh) 2014-06-06 2014-06-06 统计页面平均停留时间、确定页面用户黏性的方法和装置

Publications (2)

Publication Number Publication Date
CN104111970A true CN104111970A (zh) 2014-10-22
CN104111970B CN104111970B (zh) 2017-09-12

Family

ID=51708763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410250438.5A Active CN104111970B (zh) 2014-06-06 2014-06-06 统计页面平均停留时间、确定页面用户黏性的方法和装置

Country Status (1)

Country Link
CN (1) CN104111970B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105160006A (zh) * 2015-09-18 2015-12-16 北京京东尚科信息技术有限公司 页面内容传输方法
CN106156096A (zh) * 2015-04-02 2016-11-23 腾讯科技(深圳)有限公司 一种页面停留时间获取方法、系统以及用户终端
CN107402864A (zh) * 2017-06-07 2017-11-28 阿里巴巴集团控股有限公司 访问时长的处理方法、装置及设备、可读介质
CN109949887A (zh) * 2019-03-18 2019-06-28 深圳安泰创新科技股份有限公司 会诊记录方法、装置及计算机可读存储介质
CN110071912A (zh) * 2019-03-26 2019-07-30 阿里巴巴集团控股有限公司 数据检验方法、装置以及系统
CN111399947A (zh) * 2020-06-02 2020-07-10 平安国际智慧城市科技股份有限公司 应用程序引导页优化推送方法、装置及计算机设备
CN111427642A (zh) * 2020-02-27 2020-07-17 中国平安人寿保险股份有限公司 数据处理方法、装置、终端设备及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075909A (zh) * 2006-09-18 2007-11-21 腾讯科技(深圳)有限公司 网站访问信息统计系统以及网站访问信息统计方法
CN101122904A (zh) * 2006-08-08 2008-02-13 任喜军 因特网网页价值评估、衡量方法
US20130110648A1 (en) * 2011-10-31 2013-05-02 Simon Raab System and method for click fraud protection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101122904A (zh) * 2006-08-08 2008-02-13 任喜军 因特网网页价值评估、衡量方法
CN101075909A (zh) * 2006-09-18 2007-11-21 腾讯科技(深圳)有限公司 网站访问信息统计系统以及网站访问信息统计方法
US20130110648A1 (en) * 2011-10-31 2013-05-02 Simon Raab System and method for click fraud protection

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156096A (zh) * 2015-04-02 2016-11-23 腾讯科技(深圳)有限公司 一种页面停留时间获取方法、系统以及用户终端
CN105160006A (zh) * 2015-09-18 2015-12-16 北京京东尚科信息技术有限公司 页面内容传输方法
CN105160006B (zh) * 2015-09-18 2019-01-22 北京京东尚科信息技术有限公司 页面内容传输方法
CN107402864A (zh) * 2017-06-07 2017-11-28 阿里巴巴集团控股有限公司 访问时长的处理方法、装置及设备、可读介质
CN107402864B (zh) * 2017-06-07 2020-08-04 阿里巴巴集团控股有限公司 访问时长的处理方法、装置及设备、可读介质
CN109949887A (zh) * 2019-03-18 2019-06-28 深圳安泰创新科技股份有限公司 会诊记录方法、装置及计算机可读存储介质
CN110071912A (zh) * 2019-03-26 2019-07-30 阿里巴巴集团控股有限公司 数据检验方法、装置以及系统
CN110071912B (zh) * 2019-03-26 2021-05-04 创新先进技术有限公司 数据检验方法、装置以及系统
CN111427642A (zh) * 2020-02-27 2020-07-17 中国平安人寿保险股份有限公司 数据处理方法、装置、终端设备及计算机可读存储介质
CN111427642B (zh) * 2020-02-27 2024-04-26 中国平安人寿保险股份有限公司 数据处理方法、装置、终端设备及计算机可读存储介质
CN111399947A (zh) * 2020-06-02 2020-07-10 平安国际智慧城市科技股份有限公司 应用程序引导页优化推送方法、装置及计算机设备

Also Published As

Publication number Publication date
CN104111970B (zh) 2017-09-12

Similar Documents

Publication Publication Date Title
CN104111970A (zh) 统计页面平均停留时间、确定页面用户黏性的方法和装置
US9886517B2 (en) Ranking product information
CN103927307B (zh) 一种识别网站用户的方法和装置
TWI554895B (zh) Search results sorting methods and systems, search results sorting optimization methods and systems
US20070244739A1 (en) Techniques for measuring user engagement
CN104410516B (zh) 一种用户业务感知度评估方法和装置
CN109241343B (zh) 一种刷量用户识别系统、方法及装置
TW201939379A (zh) 資訊轉化率的預測、資訊推薦方法和裝置
CN104090908A (zh) 统计页面组的平均停留时间、网站内容推广的方法和装置
CN102932206B (zh) 监测网站访问信息的方法和系统
CN104050197B (zh) 一种信息检索系统评测方法和装置
US20070256033A1 (en) System and method for flagging information content
US20140379490A1 (en) Attribution Marketing Recommendations
US8818927B2 (en) Method for generating rules and parameters for assessing relevance of information derived from internet traffic
EP2541445A2 (en) A method and a system for analysing impact of changes to content of a website
CN103383702A (zh) 一种基于用户投票排名的个性化新闻推荐的方法及系统
CN105260913A (zh) 用于互联网广告投放的ctr预估方法、dsp服务器、系统
US10057155B2 (en) Method and apparatus for determining automatic scanning action
CN103744941A (zh) 一种基于网站属性信息确定网站评测结果的方法和装置
CN103577505A (zh) 媒体文件的兴趣度预测方法和系统
CN107992978A (zh) 一种网贷平台的风险预警方法及相关装置
CN108121749A (zh) 网站用户行为分析方法及装置
CN103685198B (zh) 一种交互用户数据的方法和装置
CN108093013B (zh) 一种网页数据计算方法及服务器
CN111784173A (zh) Ab实验数据处理方法、装置、服务器及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant