CN104090908A - 统计页面组的平均停留时间、网站内容推广的方法和装置 - Google Patents
统计页面组的平均停留时间、网站内容推广的方法和装置 Download PDFInfo
- Publication number
- CN104090908A CN104090908A CN201410250392.7A CN201410250392A CN104090908A CN 104090908 A CN104090908 A CN 104090908A CN 201410250392 A CN201410250392 A CN 201410250392A CN 104090908 A CN104090908 A CN 104090908A
- Authority
- CN
- China
- Prior art keywords
- page
- residence time
- group
- mean residence
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种统计页面组的平均停留时间、网站内容推广的方法和装置,其中,统计页面组的平均停留时间的方法包括:对于网站中内容相关的一组页面,统计出设定时间段内该组页面中的每个页面的平均停留时间以及访问次数;并对于该组页面中的每个页面,根据该页面的访问次数、平均停留时间以及该组页面中的首页面的访问次数,计算该页面的等价平均停留时间;将该组页面中的各页面的等价平均停留时间之和,作为该组页面的平均停留时间。由于本发明在统计内容相关的一组页面的平均停留时间时,将该组页面中的各页面的访问次数也考虑在内,提高了统计出的该组页面的平均停留时间的准确性,有利于网站运营人员进行运营决策。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种统计页面组的平均停留时间、网站内容推广的方法和装置。
背景技术
通常,一个网站中包含多个页面,网站运营人员可以在网站页面上发布想要公开的资讯,或者利用网站来提供相关的网络服务。人们可以通过网页浏览器来访问网站,获取需要的资讯或者享受网络服务。
页面的停留时间通俗的讲就是用户在浏览这个页面时所花费的时间,在一定程度上反映了该页面对用户的黏性。在实际应用中,网络服务器对于网站的一个页面,将用户访问该页面的时间(t1)和访问下一个页面的时间(t2)的差值(t2-t1)作为用户浏览该页面的时间,即该页面的停留时间。而一个页面的平均停留时间指的是该页面的每次访问的停留时间之和与该页面的访问次数的比值。网站运营人员通常将页面的平均停留时间作为衡量网站的性能的一个指标,来了解网站页面的内容质量,并为网站运营提供决策支持。
目前,由于方便排版或提升网站访问量等原因,网站编辑们越来越倾向于将一条较长的信息(如新闻资讯、图集等)分成连续的一组页面进行展示,也就是说这一组页面中的各页面的内容相关。在本文中,将网站中内容相关的一组页面称为页面组。现有的对网站中页面组的平均停留时间进行统计的方法是:统计出该页面组中的每个页面的平均停留时间,将该页面组中的每个页面的平均停留时间相加作为该页面组的平均停留时间。
然而,现有的方法统计出的页面组的平均停留时间往往虚高,偏离实际情况,使得网站运营人员根据现有的方法统计出的页面组的平均停留时间作出的运营决策可能不能达到预期的效果。
因此,有必要提供一种可以更准确的计算页面组的平均停留时间的方法,以帮助网站运营人员作出更为合理的运营决策。
发明内容
针对上述现有技术存在的缺陷,本发明实施例提供了一种统计页面组的平均停留时间、网站内容推广的方法和装置,用以提高统计页面组的平均停留时间的准确性,并实现网站内容的推广。
本发明实施例提供了一种统计页面组的平均停留时间的方法,包括:
对于网站中内容相关的一组页面,统计出设定时间段内该组页面中的每个页面的平均停留时间以及访问次数;并
对于该组页面中的每个页面,根据该页面的访问次数、平均停留时间以及该组页面中的首页面的访问次数,计算该页面的等价平均停留时间;
将该组页面中的各页面的等价平均停留时间之和,作为该组页面的平均停留时间。
较佳地,所述根据该页面的访问次数、平均停留时间以及该组页面中的首页面的访问次数,计算该页面的等价平均停留时间,具体包括:
计算出该页面的访问次数与所述首页面的访问次数的比值后,将该比值与该页面的平均停留时间的乘积作为该页面的等价平均停留时间。
较佳地,所述统计出设定时间段内该组页面中的每个页面的平均停留时间,具体包括:
对于该组页面中的每个页面,获取所述设定时间段内网站服务器记录的该页面的停留时间;其中,大于预设会话时间阈值的该页面的停留时间以空值null表示;
计算出值为null的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重;并根据获取的非null值的该页面的停留时间,计算出该页面的平均停留时间的基础值;
若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为该页面的平均停留时间。
较佳地,所述若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定该页面的平均停留时间,具体包括:
若判定所述比重大于预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值;若是,则将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到该页面的平均停留时间;否则,将所述比重与预设会话时间阈值相乘,得到该页面的平均停留时间。
本发明实施例还提供了一种网站内容推广的方法,包括:
对于网站中若干个待统计的网站内容,针对每个网站内容根据上述的统计页面组的平均停留时间的方法统计出与该网站内容相关的一组网页的平均停留时间,进而根据与该网站内容相关的一组页面的平均停留时间,确定出所述网站的访问者对该网站内容的黏性;
根据确定出的各网站内容的黏性、以及预设的网站内容的黏性与推广力度级别之间的对应关系,确定各网站内容在所述网站上的推广力度级别。
本发明实施例还提供了一种统计页面组的平均停留时间的装置,包括:
统计模块,用于对于网站中内容相关的一组页面,统计出设定时间段内该组页面中的每个页面的平均停留时间以及访问次数;
等价计算模块,用于对于该组页面中的每个页面,根据该页面的访问次数、平均停留时间以及该组页面中的首页面的访问次数,计算该页面的等价平均停留时间;
平均停留时间计算模块,用于将该组页面中的各页面的等价平均停留时间相加,将相加得到的和作为该组页面的平均停留时间。
较佳地,所述等价计算模块具体用于对于所述内容相关的一组页面中的每个页面,计算出该页面的访问次数与所述首页面的访问次数的比值后,将该比值与该页面的平均停留时间的乘积作为该页面的等价平均停留时间。
较佳地,所述统计模块具体包括:
停留时间获取单元,用于对于所述内容相关的一组页面中的每个页面,获取所述设定时间段内网站服务器记录的该页面的停留时间;其中,大于预设会话时间阈值的该页面的停留时间以空值null表示;
比重计算单元,用于对于所述内容相关的一组页面中的每个页面,从所述停留时间获取单元获取的该页面的停留时间中统计出值为null的该页面的停留时间的个数,将该个数在所述停留时间获取单元获取的该页面的停留时间的个数中所占的比重,作为该页面的停留时间的null值比重;
基础值计算单元,用于对于所述内容相关的一组页面中的每个页面,根据所述停留时间获取单元获取的非null值的该页面的停留时间,计算出该页面的平均停留时间的基础值;
统计单元,用于对于所述内容相关的一组页面中的每个页面,若判定该页面的停留时间的null值比重大于预设比重阈值,则根据该页面的停留时间的null值比重与所述预设会话时间阈值确定该页面的平均停留时间;否则,将该页面的平均停留时间的基础值作为该页面的平均停留时间。
较佳地,所述统计单元具体用于对于所述内容相关的一组页面中的每个页面,若判定该页面的停留时间的null值比重大于所述预设比重阈值,则进一步判断该页面的平均停留时间的基础值是否大于预设停留时间阈值,若是,则将该页面的停留时间的null值比重与预设会话时间阈值相乘后,与该页面的平均停留时间的基础值相加,得到该页面的平均停留时间,否则将该页面的停留时间的null值比重与预设会话时间阈值相乘,得到该页面的平均停留时间;若判断该页面的停留时间的null值比重小于等于所述预设比重阈值,则将该页面的平均停留时间的基础值作为该页面的平均停留时间。
本发明实施例还提供了一种网站内容推广的装置,包括:
上述的统计页面组的平均停留时间的装置;
黏性确定模块,用于对于网站中若干个网站内容,针对每个网站内容根据所述统计页面组的平均停留时间的装置统计出的、与该网站内容相关的一组网页的平均停留时间,确定出所述网站的访问者对该网站内容的黏性;
推广力度确定模块,用于根据确定出的各网站内容的黏性、以及预设的网站内容的黏性与推广力度级别之间的对应关系,确定各网站内容在所述网站上的推广力度级别。
本发明的技术方案中,计算页面组的平均停留时间时,将统计出的页面组中的各页面的访问次数也考虑在内,根据页面组中的首页面的访问次数,对页面组中的各页面的平均停留时间进行等价计算,即得到各页面的等价平均停留时间。之后,将页面组中的各页面的等价平均停留时间进行相加,得到页面组的平均停留时间,从而通过将页面组中的各页面的访问次数考虑在内,本发明提高了统计出的页面组的平均停留时间的准确性,可供网站运营人员进行参考,以便于作出更为合理的运营决策。而且,基于计算出的页面组的平均停留时间可进一步进行网站内容推广力度级别的确定,从而实现网站内容的推广。
附图说明
图1为本发明实施例的统计页面组的平均停留时间的方法流程图;
图2为本发明实施例的统计页面组中的一个页面的平均停留时间的方法流程图;
图3为本发明实施例的统计页面组的平均停留时间的装置的内部结构框图;
图4为本发明实施例的统计模块的内部结构框图;
图5为本发明实施例的网站内容推广装置的内部结构框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举出优选实施例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以实现本发明的这些方面。
本申请使用的“模块”、“系统”等术语旨在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限于:处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。一个或多个模块可以位于执行中的一个进程和/或线程内。
本发明的发明人对现有技术进行分析研究后发现,现有技术的方法在计算页面组的平均停留时间时,并没有考虑页面组中的各页面的访问次数的差异,而事实上,页面组中的各页面的访问次数往往存在较大差异,即页面组中的首页面的访问次数最大,之后的各页面的访问次数依次递减;尤其是对于一条信息比较长,展示该条信息的页面组的页面数量较多的情况,页面组中的各页面的访问次数差异非常大。这样,在页面组中的各页面的访问次数不相同的情况下,仅简单的将统计出的各页面的平均停留时间进行相加得到页面组的平均停留时间的方式,使得得到的页面组的平均停留时间往往虚高,并不能反映出页面组的平均停留时间的真实情况,给网站运营人员进行运营决策造成较大干扰,也易使得作出的运营决策达不到相应的效果。
基于此,本发明的技术方案中,计算页面组的平均停留时间时,将统计出的页面组中的各页面的访问次数也考虑在内,根据页面组中的首页面的访问次数,对页面组中的各页面的平均停留时间进行等价计算,即得到各页面的等价平均停留时间。之后,将页面组中的各页面的等价平均停留时间进行相加,得到页面组的平均停留时间,从而通过将页面组中的各页面的访问次数考虑在内,本发明提高了统计出的页面组的平均停留时间的准确性,可供网站运营人员进行参考,以便于作出更为合理的运营决策。
下面结合附图详细说明本发明的技术方案。本发明实施例中,对于网站中内容相关的一组页面,统计出设定时间段内该组页面中的每个页面的平均停留时间以及访问次数;并对于该组页面中的每个页面,根据该页面的访问次数、平均停留时间以及该组页面中的首页面的访问次数,计算该页面的等价平均停留时间;将该组页面中的各页面的等价平均停留时间之和,作为该组页面的平均停留时间。下面以流程图的方式详细介绍本发明提供的统计页面组的平均停留时间的方法,如图1所示,具体包括如下步骤:
S101:对于网站中的页面组,统计出设定时间段内该页面组中的每个页面的平均停留时间以及访问次数。
具体地,将网站中的页面组即网站中内容相关的一组页面。对于网站中的每个页面,网络服务器会记录该页面的访问次数,以及每次访问的停留时间。在本步骤中,对于网站中的页面组中的每个页面,获取设定时间段内网络服务器记录的该页面的停留时间以及访问次数,之后,可采用现有方法统计出设定时间段内的该页面的平均停留时间,即:将获取的该页面的各停留时间的和,与获取的设定时间段内的该页面的访问次数的比值作为该页面的平均停留时间。
较优地,对于网站中的页面组中的每个页面,还可采用如下图2所示的方法,以更为准确地统计出设定时间段内的该页面的平均停留时间,从而可使得统计出的页面组的平均停留时间也更为准确。
S102:对于页面组中的每个页面,根据该页面的访问次数、平均停留时间以及该页面组中的首页面的访问次数,计算该页面的等价平均停留时间。
具体地,网站中的页面组是指展示一条信息(即一个网站内容)的相关页面,用户阅读该条信息时,首先进入该页面组中的首页面(即展示该条信息的第一个页面),之后再依次阅读后面的其它页面。因此,页面组中的首页面的访问次数在页面组中的各页面的访问次数中最大。
在本步骤中,对于页面组中的每个页面,可以计算出该页面的访问次数与页面组中的首页面的访问次数的比值,将该比值与该页面的平均停留时间的乘积作为该页面的等价平均停留时间。其中,对于页面组中的首页面而言,其等价平均停留时间也就是其平均停留时间。
例如,页面组中的首页面的平均停留时间和访问次数分别为T1和V1,页面组中的非首页面的各页面的平均停留时间分别为T2,T3,…,Tn,相应地,访问次数分别为V2,V3,…,Vn,则页面组中的各页面的等价平均停留时间P1,P2,P3,…,Pn分别为:
P1=T1×V1/V1=T1,
P2=T2×V2/V1,
P3=T3×V3/V1,…,
Pn=Tn×Vn/V1。
考虑到网站运营人员通过网站中的页面组进行一个网站内容的展示时,通常将该网站内容中较为重要的部分放于该页面组的首页面中进行展示,也就是说页面组中的首页面中的内容与页面组中的其他页面的内容相比更为重要,因此还可预先根据页面组中的每个页面对该网站内容的重要性,设置页面组中每个页面的权重,从而,对于页面组中的每个页面,可以计算出该页面的访问次数与页面组中的首页面的访问次数的比值,将该比值与该页面的权重相乘后,再与该页面的平均停留时间相乘,得到该页面的等价平均停留时间。其中,页面组中的首页面的权重可以设置为1,其它页面的可以设置为小于1大于0.9的数值。
S103:将页面组中的各页面的等价平均停留时间之和,作为页面组的平均停留时间。
在上述步骤的例子中,页面组的平均停留时间T=P1+P2+P3+…+Pn。
例如,表1示出了一个页面组中的各页面的平均停留时间和访问次数,根据现有的方法统计出的该页面组的平均停留时间为:
T=T1+T2+T3=60+50+80=190s。
根据本发明图1所示的方法统计出的该页面组的平均停留时间为:
表1
基于上述的统计页面组的平均停留时间的方法,本发明实施例的网站内容推广的方法,具体包括:对于网站中若干个待统计的网站内容,针对每个网站内容根据上述的统计页面组的平均停留时间的方法,统计出与该网站内容相关的一组网页的平均停留时间,进而根据与该网站内容相关的一组页面的平均停留时间,确定出网站的访问者对该网站内容的黏性;之后,根据确定出的各网站内容的黏性、以及预设的网站内容的黏性与推广力度级别之间的对应关系,确定各网站内容在网站上的推广力度级别。其中,对于网站中的一个网站内容,根据与该网站内容相关的一组页面的平均停留时间,确定出网站的访问者对该网站内容的黏性的一种方法,具体可以是根据与该网站内容相关的一组页面的平均停留时间、以及由本领域技术人员根据实际需求设定的平均停留时间与黏性之间的对应关系,来确定出网站的访问者对该网站内容的黏性。
通常,对于网站中的一个网站内容,与该网站内容相关的一组页面的平均停留时间可以反映出网站的访问者对该网站内容的黏性,与该网站内容相关的一组页面的平均停留时间越长,网站的访问者对该网站内容的黏性越大。而且,可以设定网站内容的黏性越小,网站内容在网站上的推广力度级别越高,也就是确定出的一个网站内容的黏性小,表面该网站内容的推广力度不够,则可以增大该网站内容在网站上的推广力度。
对于网站中的页面组中的任一页面A,统计出设定时间段内的该页面A的平均停留时间的方法的流程,如图2所示,具体包括如下步骤:
S201:获取设定时间段内网站服务器记录的页面A的停留时间。
具体地,网站服务器中记录有网站的页面的停留时间,对于页面A,获取设定时间段内(如一个月)网站服务器记录的页面A的停留时间。其中,大于预设会话时间阈值的页面A的停留时间以null(空值)表示。通常,预设会话时间阈值由本领域技术人员进行设定,具体可以是30分钟。
S202:计算出值为null的页面A的停留时间的个数在获取的页面A的停留时间的个数中所占的比重,作为页面A的停留时间的null值比重。
S203:根据获取的非null值的页面A的停留时间,计算出页面A的平均停留时间的基础值。
具体地,可根据现有技术的方法,将获取的非null值的页面A的停留时间的平均值,作为页面A的平均停留时间的基础值。
较优地,还可以将获取的非null值(即值不为null)的页面A的停留时间进行排序,选取排序在预设的排序区间内的页面A的停留时间后,计算出选取出的页面A的停留时间的平均值,作为页面A的平均停留时间的基础值。其中,预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),n为获取的页面A的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整。这样,选取排序在预设排序区间内的页面A的停留时间也就是选取排序在第INT(m1×n)位与第INT(m2×n)位之间的页面A的停留时间。m1和m2可以由本领域技术人员进行设定,m1具体可以为20%,m2具体可以为80%。例如,获取的非null值的页面A的停留时间为101个,则可确定出预设的排序区间的端点为20和80,即选取出排序第20位和第80位之间的页面A的停留时间。
这种将排序靠前和靠后的部分停留时间排除掉的方式,可以排除一些因用户行为差异导致的干扰数据,尤其是该方式很好地排除了那些手误打开网站页面后,又立即关闭该页面的情况,较好地提高了页面平均停留时间计算的准确性。
其中,上述步骤S202和S203并没有严格的执行顺序,也就是可以先执行S202,也可以先执行S203,还可以并行执行S202和S203。
S204:判断计算出的页面A的停留时间的null值比重是否大于预设比重阈值;若是,则执行步骤S205;否则,执行步骤S208。
若在本步骤中,若判定计算出的页面A的停留时间的null值比重大于预设比重阈值,则可根据计算出的页面A的停留时间的null值比重与预设会话时间阈值确定页面A的平均停留时间,具体如下述步骤S205~S207所示;若判定计算出的页面A的停留时间的null值比重小于等于预设比重阈值,则可将计算出的页面A的平均停留时间的基础值作为页面A的平均停留时间,具体如下述步骤S208所示。其中,预设比重阈值具体由本领域技术人员根据实际需求或经验进行设定,例如,预设比重阈值可以设定为20%。
S205:判断计算出的页面A的平均停留时间的基础值是否大于预设停留时间阈值;若是,则执行步骤S206;否则,执行步骤S207。
其中,预设停留时间阈值由本领域技术人员进行设定,具体可以是90s。
S206:将页面A的停留时间的null值比重与预设会话时间阈值相乘后,与页面A的平均停留时间的基础值相加,将得到的和作为页面A的平均停留时间。
具体地,若页面A的停留时间的null值比重大于预设比重阈值,页面A的平均停留时间的基础值大于预设停留时间阈值,则计算出页面A的停留时间的null值比重与预设会话时间阈值的乘积,将计算出的乘积与页面A的平均停留时间的基础值的和作为页面A的平均停留时间。通常,包含有诸如视频类内容的页面的平均停留时间较长,这样,也就容易出现因用户一直浏览该页面而使得该页面的停留时间中大于预设会话时间阈值的个数较多,即该页面的停留时间的null值比重较大,且此时该页面的平均停留时间的基础值也会较大。因此,当页面A的停留时间的null值比重较大,且页面A的平均停留时间的基础值也较大时,表明页面A包含诸如视频类内容的可能性很大,将页面A的停留时间的null值比重与预设会话时间阈值相乘后,与页面A的平均停留时间的基础值相加,将得到的和作为页面A的平均停留时间。
S207:将页面A的停留时间的null值比重与预设会话时间阈值相乘后,将得到的乘积作为页面A的平均停留时间。
具体地,若页面A的停留时间的null值比重大于预设比重阈值,页面A的平均停留时间的基础值小于等于预设停留时间阈值,则计算出页面A的停留时间的null值比重与预设会话时间阈值的乘积,将计算出的乘积作为页面A的平均停留时间。如前所述,通常包含有诸如视频类内容的页面的平均停留时间较长,这样,也就容易出现因用户一直浏览该页面而使得该页面的停留时间中大于预设会话时间阈值的个数较多,即该页面的停留时间的null值比重较大,且此时该页面的平均停留时间的基础值也会较大。若当页面A的停留时间的null值比重较大,反而页面A的平均停留时间的基础值较小,表明获取的非null值的页面A的停留时间中,可能很多是因用户手误打开页面A后,又关闭页面A的情况,为保证计算页面A的平均停留时间的准确性,可将这部分数据去除掉,也就是将页面A的停留时间的null值比重与预设会话时间阈值的乘积作为页面A的平均停留时间。
S208:将计算出的页面A的平均停留时间的基础值作为页面A的平均停留时间。
具体地,若计算出的页面A的停留时间的null值比重小于等于预设比重阈值,则表面出现的这些小比例的值为null的页面A的停留时间,可能是因一些用户有事离开而长时间为关闭网页,是计算页面A的平均停留时间时的干扰数据,也就是说,页面A的停留时间的null值比重较小时,表明这些null值的出现是由于一些用户打开页面A后离开未关闭页面引起的,而不是用户一直在浏览页面A的内容。因此,若计算出的页面A的停留时间的null值比重小于等于预设比重阈值,则将计算出的页面A的平均停留时间的基础值作为页面A的平均停留时间。
基于上述的统计页面组的平均停留时间的方法,本发明实施例提供的统计页面组的平均停留时间的装置的内部结构框图,如图3所示,包括:统计模块301、等价计算模块302和平均停留时间计算模块303。
统计模块301用于对于网站中内容相关的一组页面,统计出设定时间段内该组页面中的每个页面的平均停留时间以及访问次数。
等价计算模块302用于对于该组页面中的每个页面,根据该页面的访问次数、平均停留时间以及该组页面中的首页面的访问次数,计算该页面的等价平均停留时间。具体地,等价计算模块302对于网站中内容相关的一组页面中的每个页面,计算出该页面的访问次数与该组页面中的首页面的访问次数的比值后,将该比值与该页面的平均停留时间的乘积作为该页面的等价平均停留时间。
平均停留时间计算模块303用于将该组页面中的各页面的等价平均停留时间相加,将相加得到的和作为该组页面的平均停留时间。
其中,上述的统计模块301的内部结构框图,如图4所示,包括:停留时间获取单元401、比重计算单元402、基础值计算单元403和统计单元404。
停留时间获取单元401用于对于网站中内容相关的一组页面中的每个页面,获取设定时间段内网站服务器记录的该页面的停留时间;其中,大于预设会话时间阈值的该页面的停留时间以空值null表示。
比重计算单元402用于对于网站中内容相关的一组页面中的每个页面,从停留时间获取单元401获取的该页面的停留时间中,统计出值为null的该页面的停留时间的个数,将该个数在停留时间获取单元401获取的该页面的停留时间的个数中所占的比重,作为该页面的停留时间的null值比重。
基础值计算单元403用于对于网站中内容相关的一组页面中的每个页面,根据停留时间获取单元401获取的非null值的该页面的停留时间,计算出该页面的平均停留时间的基础值。具体地,基础值计算单元403对于网站中国内容相关的一组页面中的每个页面,将停留时间获取单元401获取的非null的该页面的停留时间进行排序,选取排序在预设的排序区间内的该页面的停留时间后,计算出选取出的该页面的停留时间的平均值,作为该页面的平均停留时间的基础值;其中,预设的排序区间的两个端点分别为INT(m1×n)和INT(m2×n),n为获取的该页面的平均停留时间的个数,m1和m2为预设的百分比,且m1<m2;INT(m1×n)表示对m1×n取整;INT(m2×n)表示对m2×n取整。
统计单元404用于对于网站中内容相关的一组页面中的每个页面,若判定该页面的停留时间的null值比重大于预设比重阈值,则根据该页面的停留时间的null值比重与预设会话时间阈值确定该页面的平均停留时间;否则,将该页面的平均停留时间的基础值作为该页面的平均停留时间。
具体地,统计单元404对于网站中内容相关的一组页面中的每个页面,若判定该页面的停留时间的null值比重大于预设比重阈值,则进一步判断该页面的平均停留时间的基础值是否大于预设停留时间阈值,若是,则将该页面的停留时间的null值比重与预设会话时间阈值相乘后,与该页面的平均停留时间的基础值相加,得到该页面的平均停留时间,否则将该页面的停留时间的null值比重与预设会话时间阈值相乘,得到该页面的平均停留时间;若判断该页面的停留时间的null值比重小于等于预设比重阈值,则将该页面的平均停留时间的基础值作为该页面的平均停留时间。
基于上述的网站内容推广的方法,本发明实施例提供的网站内容推广的装置的内部结构框图如图5所示,具体包括:上述的统计页面组的平均停留时间的装置中的统计模块301、等价计算模块302和平均停留时间计算模块303,以及黏性确定模块501和推广力度确定模块502。
黏性确定模块501用于对于网站中若干个网站内容,针对每个网站内容根据统计页面组的平均停留时间的装置统计出的、与该网站内容相关的一组网页的平均停留时间,确定出网站的访问者对该网站内容的黏性。
推广力度确定模块502用于根据黏性确定模块501确定出的各网站内容的黏性、以及预设的网站内容的黏性与推广力度级别之间的对应关系,确定各网站内容在网站上的推广力度级别。
综上所述,本发明的技术方案中,计算页面组的平均停留时间时,将统计出的页面组中的各页面的访问次数也考虑在内,根据页面组中的首页面的访问次数,对页面组中的各页面的平均停留时间进行等价计算,即得到各页面的等价平均停留时间。之后,将页面组中的各页面的等价平均停留时间进行相加,得到页面组的平均停留时间,从而通过将页面组中的各页面的访问次数考虑在内,本发明提高了统计出的页面组的平均停留时间的准确性,可供网站运营人员进行参考,以便于作出更为合理的运营决策。而且,基于计算出的页面组的平均停留时间可进一步进行网站内容推广力度级别的确定,从而实现网站内容的推广。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读取存储介质中,如:ROM/RAM、磁碟、光盘等。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种统计页面组的平均停留时间的方法,其特征在于,包括:
对于网站中内容相关的一组页面,统计出设定时间段内该组页面中每个页面的平均停留时间以及访问次数;并
对于该组页面中的每个页面,根据该页面的访问次数、平均停留时间以及该组页面中的首页面的访问次数,计算该页面的等价平均停留时间;
将该组页面中的各页面的等价平均停留时间之和,作为该组页面的平均停留时间。
2.如权利要求1所述的方法,其特征在于,所述根据该页面的访问次数、平均停留时间以及该组页面中的首页面的访问次数,计算该页面的等价平均停留时间,具体包括:
计算出该页面的访问次数与所述首页面的访问次数的比值后,将该比值与该页面的平均停留时间的乘积作为该页面的等价平均停留时间。
3.如权利要求1或2所述的方法,其特征在于,所述统计出设定时间段内该组页面中的每个页面的平均停留时间,具体包括:
对于该组页面中的每个页面,获取所述设定时间段内网站服务器记录的该页面的停留时间;其中,大于预设会话时间阈值的该页面的停留时间以空值null表示;
计算出值为null的该页面的停留时间的个数在获取的该页面的停留时间的个数中所占的比重;并根据获取的非null值的该页面的停留时间,计算出该页面的平均停留时间的基础值;
若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定所述页面的平均停留时间;否则,将所述基础值作为该页面的平均停留时间。
4.如权利要求3所述的方法,其特征在于,所述若判定所述比重大于预设比重阈值,则根据所述比重与所述预设会话时间阈值确定该页面的平均停留时间,具体包括:
若判定所述比重大于预设比重阈值,则进一步判断所述基础值是否大于预设停留时间阈值;若是,则将所述比重与预设会话时间阈值相乘后与所述基础值相加,得到该页面的平均停留时间;否则,将所述比重与预设会话时间阈值相乘,得到该页面的平均停留时间。
5.一种网站内容推广的方法,其特征在于,包括:
对于网站中若干个待统计的网站内容,针对每个网站内容根据如权利要求1-4任一所述的方法统计出与该网站内容相关的一组网页的平均停留时间,进而根据与该网站内容相关的一组页面的平均停留时间,确定出所述网站的访问者对该网站内容的黏性;
根据确定出的各网站内容的黏性、以及预设的网站内容的黏性与推广力度级别之间的对应关系,确定各网站内容在所述网站上的推广力度级别。
6.一种统计页面组的平均停留时间的装置,其特征在于,包括:
统计模块,用于对于网站中内容相关的一组页面,统计出设定时间段内该组页面中的每个页面的平均停留时间以及访问次数;
等价计算模块,用于对于该组页面中的每个页面,根据该页面的访问次数、平均停留时间以及该组页面中的首页面的访问次数,计算该页面的等价平均停留时间;
平均停留时间计算模块,用于将该组页面中的各页面的等价平均停留时间相加,将相加得到的和作为该组页面的平均停留时间。
7.如权利要求6所述的装置,其特征在于,
所述等价计算模块具体用于对于所述内容相关的一组页面中的每个页面,计算出该页面的访问次数与所述首页面的访问次数的比值后,将该比值与该页面的平均停留时间的乘积作为该页面的等价平均停留时间。
8.如权利要求6或7所述的装置,其特征在于,所述统计模块具体包括:
停留时间获取单元,用于对于所述内容相关的一组页面中的每个页面,获取所述设定时间段内网站服务器记录的该页面的停留时间;其中,大于预设会话时间阈值的该页面的停留时间以空值null表示;
比重计算单元,用于对于所述内容相关的一组页面中的每个页面,从所述停留时间获取单元获取的该页面的停留时间中统计出值为null的该页面的停留时间的个数,将该个数在所述停留时间获取单元获取的该页面的停留时间的个数中所占的比重,作为该页面的停留时间的null值比重;
基础值计算单元,用于对于所述内容相关的一组页面中的每个页面,根据所述停留时间获取单元获取的非null值的该页面的停留时间,计算出该页面的平均停留时间的基础值;
统计单元,用于对于所述内容相关的一组页面中的每个页面,若判定该页面的停留时间的null值比重大于预设比重阈值,则根据该页面的停留时间的null值比重与所述预设会话时间阈值确定该页面的平均停留时间;否则,将该页面的平均停留时间的基础值作为该页面的平均停留时间。
9.如权利要求8所述的装置,其特征在于,
所述统计单元具体用于对于所述内容相关的一组页面中的每个页面,若判定该页面的停留时间的null值比重大于所述预设比重阈值,则进一步判断该页面的平均停留时间的基础值是否大于预设停留时间阈值,若是,则将该页面的停留时间的null值比重与预设会话时间阈值相乘后,与该页面的平均停留时间的基础值相加,得到该页面的平均停留时间,否则将该页面的停留时间的null值比重与预设会话时间阈值相乘,得到该页面的平均停留时间;若判断该页面的停留时间的null值比重小于等于所述预设比重阈值,则将该页面的平均停留时间的基础值作为该页面的平均停留时间。
10.一种网站内容推广的装置,其特征在于,包括:
如权利要求6-9任一所述的统计页面组的平均停留时间的装置;
黏性确定模块,用于对于网站中若干个网站内容,针对每个网站内容根据所述统计页面组的平均停留时间的装置统计出的、与该网站内容相关的一组网页的平均停留时间,确定出所述网站的访问者对该网站内容的黏性;
推广力度确定模块,用于根据确定出的各网站内容的黏性、以及预设的网站内容的黏性与推广力度级别之间的对应关系,确定各网站内容在所述网站上的推广力度级别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410250392.7A CN104090908B (zh) | 2014-06-06 | 2014-06-06 | 统计页面组的平均停留时间、网站内容推广的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410250392.7A CN104090908B (zh) | 2014-06-06 | 2014-06-06 | 统计页面组的平均停留时间、网站内容推广的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104090908A true CN104090908A (zh) | 2014-10-08 |
CN104090908B CN104090908B (zh) | 2017-11-03 |
Family
ID=51638624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410250392.7A Active CN104090908B (zh) | 2014-06-06 | 2014-06-06 | 统计页面组的平均停留时间、网站内容推广的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104090908B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106598975A (zh) * | 2015-10-15 | 2017-04-26 | 阿里巴巴集团控股有限公司 | 一种页面访问流量参数获取方法及装置 |
CN108495150A (zh) * | 2018-01-24 | 2018-09-04 | 北京奇艺世纪科技有限公司 | 一种视频点击满意度的确定方法及装置 |
CN108804387A (zh) * | 2017-04-27 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 目标用户确定方法及装置 |
CN110046317A (zh) * | 2019-03-13 | 2019-07-23 | 平安城市建设科技(深圳)有限公司 | Ios应用的页面信息记录方法、终端及存储介质 |
CN110189092A (zh) * | 2019-04-10 | 2019-08-30 | 阿里巴巴集团控股有限公司 | 审核组成员评估方法及装置 |
CN111399947A (zh) * | 2020-06-02 | 2020-07-10 | 平安国际智慧城市科技股份有限公司 | 应用程序引导页优化推送方法、装置及计算机设备 |
CN113177176A (zh) * | 2021-05-21 | 2021-07-27 | 脸萌有限公司 | 特征构建方法、内容显示方法及相关装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1890659A (zh) * | 2003-11-20 | 2007-01-03 | 奥姆尼图雷有限公司 | 给促进商业成功的元素指定数值 |
CN101122904A (zh) * | 2006-08-08 | 2008-02-13 | 任喜军 | 因特网网页价值评估、衡量方法 |
CN102591990A (zh) * | 2012-01-16 | 2012-07-18 | 广州市动景计算机科技有限公司 | 一种获取网站用户点击信息的方法和装置 |
US20130110648A1 (en) * | 2011-10-31 | 2013-05-02 | Simon Raab | System and method for click fraud protection |
CN103218431A (zh) * | 2013-04-10 | 2013-07-24 | 金军 | 一种能识别网页信息自动采集的系统与方法 |
-
2014
- 2014-06-06 CN CN201410250392.7A patent/CN104090908B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1890659A (zh) * | 2003-11-20 | 2007-01-03 | 奥姆尼图雷有限公司 | 给促进商业成功的元素指定数值 |
CN101122904A (zh) * | 2006-08-08 | 2008-02-13 | 任喜军 | 因特网网页价值评估、衡量方法 |
US20130110648A1 (en) * | 2011-10-31 | 2013-05-02 | Simon Raab | System and method for click fraud protection |
CN102591990A (zh) * | 2012-01-16 | 2012-07-18 | 广州市动景计算机科技有限公司 | 一种获取网站用户点击信息的方法和装置 |
CN103218431A (zh) * | 2013-04-10 | 2013-07-24 | 金军 | 一种能识别网页信息自动采集的系统与方法 |
Non-Patent Citations (3)
Title |
---|
WMJMICHELLE: ""页面停留时间和网站停留时间详解"", 《百度文库》 * |
秦璐: ""数据仓库技术研究及其在MIDC运营数据分析系统上的应用"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
黄润霖: ""网络上的客户价值"", 《用数字解放营销人》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106598975A (zh) * | 2015-10-15 | 2017-04-26 | 阿里巴巴集团控股有限公司 | 一种页面访问流量参数获取方法及装置 |
CN106598975B (zh) * | 2015-10-15 | 2020-04-10 | 阿里巴巴集团控股有限公司 | 一种页面访问流量参数获取方法及装置 |
CN108804387A (zh) * | 2017-04-27 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 目标用户确定方法及装置 |
CN108804387B (zh) * | 2017-04-27 | 2021-07-23 | 腾讯科技(深圳)有限公司 | 目标用户确定方法及装置 |
CN108495150A (zh) * | 2018-01-24 | 2018-09-04 | 北京奇艺世纪科技有限公司 | 一种视频点击满意度的确定方法及装置 |
CN108495150B (zh) * | 2018-01-24 | 2020-09-15 | 北京奇艺世纪科技有限公司 | 一种视频点击满意度的确定方法及装置 |
CN110046317A (zh) * | 2019-03-13 | 2019-07-23 | 平安城市建设科技(深圳)有限公司 | Ios应用的页面信息记录方法、终端及存储介质 |
CN110189092A (zh) * | 2019-04-10 | 2019-08-30 | 阿里巴巴集团控股有限公司 | 审核组成员评估方法及装置 |
CN110189092B (zh) * | 2019-04-10 | 2023-06-09 | 创新先进技术有限公司 | 审核组成员评估方法及装置 |
CN111399947A (zh) * | 2020-06-02 | 2020-07-10 | 平安国际智慧城市科技股份有限公司 | 应用程序引导页优化推送方法、装置及计算机设备 |
CN113177176A (zh) * | 2021-05-21 | 2021-07-27 | 脸萌有限公司 | 特征构建方法、内容显示方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104090908B (zh) | 2017-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104090908A (zh) | 统计页面组的平均停留时间、网站内容推广的方法和装置 | |
TWI777010B (zh) | 資訊轉化率的預測、資訊推薦方法和裝置 | |
CN108521439B (zh) | 一种消息推送的方法和装置 | |
US20190197416A1 (en) | Information recommendation method, apparatus, and server based on user data in an online forum | |
TWI554895B (zh) | Search results sorting methods and systems, search results sorting optimization methods and systems | |
CN105989074A (zh) | 一种通过移动设备信息进行推荐冷启动的方法和装置 | |
US20100185619A1 (en) | Sampling analysis of search queries | |
US11275748B2 (en) | Influence score of a social media domain | |
CN104111970A (zh) | 统计页面平均停留时间、确定页面用户黏性的方法和装置 | |
US20180308152A1 (en) | Data Processing Method and Apparatus | |
CN104424291A (zh) | 一种对搜索结果进行排序的方法及装置 | |
CN105247507A (zh) | 品牌的影响力得分 | |
CN106651416A (zh) | 应用程序推广信息的分析方法及装置 | |
CN107292463A (zh) | 一种对应用程序进行项目评估的方法及系统 | |
CN107229754B (zh) | 信息排序方法、装置、电子设备及存储介质 | |
CN102446171A (zh) | 基于加权平均点进率评测推广关键词质量度的方法与设备 | |
CN108255886B (zh) | 推荐系统的评估方法及装置 | |
CN105930507A (zh) | 一种获得用户的Web浏览兴趣的方法及装置 | |
CN103713894A (zh) | 一种用于确定用户的访问需求信息的方法与设备 | |
CN103761266A (zh) | 基于多级逻辑回归的点击率预测方法和系统 | |
CN108984735B (zh) | 标签词库更新方法、装置及电子设备 | |
CN116362823A (zh) | 用于行为稀疏场景的推荐模型训练方法、推荐方法及装置 | |
CN103870452A (zh) | 数据推荐方法及系统 | |
CN105653550B (zh) | 网页过滤方法和装置 | |
CN104991935B (zh) | 一种网站关注度的处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |