CN103095820B - 一种确定访问页面的终端数量的方法及装置 - Google Patents
一种确定访问页面的终端数量的方法及装置 Download PDFInfo
- Publication number
- CN103095820B CN103095820B CN201310001451.2A CN201310001451A CN103095820B CN 103095820 B CN103095820 B CN 103095820B CN 201310001451 A CN201310001451 A CN 201310001451A CN 103095820 B CN103095820 B CN 103095820B
- Authority
- CN
- China
- Prior art keywords
- page
- time section
- terminal quantity
- historical time
- accessed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种确定访问页面的终端数量的方法及装置,包括:获取历史时间段内访问页面集合中的页面的终端数量,以及该历史时间段内该页面集合中的页面被访问的次数;并确定获取的该终端数量与该次数的比值;以及基于确定的该比值,根据统计的评估时间段内该页面集合中的页面被访问的次数,确定该评估时间段内访问该页面集合中的页面的终端数量。采用本发明实施例提供的方案,减少了确定访问页面的终端数量时消耗的处理资源,并提高了处理效率。
Description
技术领域
本发明涉及互联网技术领域和计算机技术领域,尤其涉及一种确定访问页面的终端数量的方法及装置。
背景技术
在目前的互联网应用中,为了有针对性的对网站进行管理,经常需要统计网站被用户访问时,访问网站的用户量,也即访问网站的终端数量,也可以统计访问网站页面的终端数量。
现有技术中,当终端访问某一网站的页面时,网站服务器会记录访问日志,日志中可以包括该终端的标识,如IP地址,COOKIE,该终端使用的操作系统,该终端上安装的浏览器的版本,访问时间,以及该终端浏览的上一个页面的域名等信息,终端浏览的上一个页面也可以称作是页面本次被访问时的来源页面。
在记录的访问日志所包括的信息中,IP和COOKIE属于能够辨别终端身份的主要信息,具有唯一性。鉴于其唯一性,IP或COOKIE作为终端标识信息,可以用来统计访问网站的终端数量,即基于每条访问日志中记录的终端标识信息,可以统计一段时间内访问一个网站的终端数量,也可以统计一段时间内访问一个或多个页面的终端的数量。
然而,在用户通过终端访问网站时,经常会在短时间内多次访问一个页面或同一网站的多个页面,此时在统计访问网站的终端数量时,如果仅仅是根据访问日志中的终端标识信息进行简单叠加进行统计,显然是不准确的,而是需要对访问日志中的终端标识信息进行比对,以及对相同的终端标识信息进行排重,才能够得到准确的统计结果。
然而,对于一些访问量很大的网站,例如,每天数十亿次的页面访问,在基于对终端标识信息的比对和排重处理,对访问网站的终端数量进行统计时,需要消耗大量的处理资源,且由于数据量较大仍然需要很长的时间才能得到统计结果,实际中,往往需要数组服务器共同运算数十小时才能得到结果。
发明内容
本发明实施例提供一种确定访问页面的终端数量的方法及装置,用以解决现有技术中存在的确定访问页面的终端数量所消耗的处理资源较多,效率较低的问题。
本发明实施例提供一种确定访问页面的终端数量的方法,包括:
获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数;
确定所述终端数量与所述次数的比值;
基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量。
本发明实施例还提供一种确定访问页面的终端数量的装置,包括:
获取单元,用于获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数;
第一确定单元,用于确定所述终端数量与所述次数的比值;
第二确定单元,用于基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量。
本发明有益效果包括:
本发明实施例提供的方法中,在确定访问页面的终端数量时,首先获取历史时间段内访问页面集合中的页面的终端数量,以及该历史时间段内该页面集合中的页面被访问的次数,然后确定获取的该终端数量与该次数的比值,并基于确定的该比值,根据统计的评估时间段内该页面集合中的页面被访问的次数,确定该评估时间段内访问该页面集合中的页面的终端数量。本发明实施例提供的方案中,不再需要对访问日志中记录的终端标识信息进行比对和排重处理,只需要统计页面被访问的次数,并基于通过历史统计结果得到的访问页面的终端数量与页面被访问的次数的比值,即可以确定评估时间段内访问页面的终端数量,从而减少了处理资源的消耗,并且提高了处理效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的确定访问页面的终端数量的方法的流程图;
图2为本发明实施例1提供的确定访问页面的终端数量的方法的流程图;
图3为本发明实施例2提供的确定访问页面的终端数量的方法的流程图;
图4为本发明实施例3提供的确定访问页面的终端数量的装置的结构示意图。
具体实施方式
为了给出减少确定访问页面的终端数量时消耗的处理资源,以及提高处理效率的实现方案,本发明实施例提供了一种确定访问页面的终端数量的方法及装置,以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明实施例提供一种确定访问页面的终端数量的方法,如图1所示,包括:
步骤101、获取历史时间段内访问页面集合中的页面的终端数量,以及该历史时间段内该页面集合中的页面被访问的次数。
步骤102、确定获取的该终端数量与该次数的比值。
步骤103、基于确定的该比值,根据统计的评估时间段内该页面集合中的页面被访问的次数,确定该评估时间段内访问该页面集合中的页面的终端数量。
其中,在上述步骤101中,可以获取多个历史时间段内访问页面集合中的页面的终端数量,以及该历史时间段内该页面集合中的页面被访问的次数,后续可以基于获取的多个终端数量和多个次数确定后续步骤103中使用的比值,基于获取的多个历史访问结果确定比值,能够进一步提高最终所确定的访问页面的终端数量的准确性。
本发明实施例中,也可以针对作为来源页面的指定页面,获取历史时间段内从该指定页面出发访问页面集合中的页面的终端数量,以及该历史时间段内从该指定页面出发该页面集合中的页面被访问的次数,从而后续也可以针对该指定页面,根据统计的评估时间段内从该指定页面出发该页面集合中的页面被访问的次数,确定该评估时间段内从该指定页面出发访问该页面集合中的页面的终端数量,进而使得所确定的访问页面的终端数量更有针对性。
下面结合附图,用具体实施例对本发明提供的方法及装置进行详细描述。
实施例1:
图2为本发明实施例1中提供的确定访问页面的终端数量的方法的流程图,具体包括如下处理步骤:
步骤201、获取历史时间段内访问页面集合中的页面的终端数量。
优选的,本步骤中可以获取多个历史时间段内访问页面集合中的页面的终端数量,例如,获取n个时间段内访问页面集合中的页面的终端数量,n的取值可以根据实际需要进行灵活设置,n个时间段可以为时间长度相同的时间段,如每个时间段的时间长度为一天24小时。
本步骤中所获取的历史时间段内访问页面集合中的页面的终端数量,可以是按照现有技术基于该历史时间段内的访问日志进行统计得到的统计结果,也可以是按照本发明实施例提供的方法所确定的终端数量。
本发明实施例1中,页面集合中所包括的页面可以是一个,也可以是多个,可以根据实际需要进行灵活设置,例如,可以设置为一个网站所包括的所有页面,也可以设置为一个网站的主页面,也可以设置为一个网站的某一个栏目所对应的多个页面。
步骤202、获取该历史时间段内该页面集合中的页面被访问的次数。
优选的,当上述步骤201中,获取了多个历史时间段内访问页面集合中的页面的终端数量时,相应的,本步骤中也可以获取该多个历史时间段内该页面集合中的页面被访问的次数。
本步骤中所获取的该历史时间段内该页面集合中的页面被访问的次数,可以是基于该历史时间段内的访问日志进行统计得到的统计结果,在统计该次数时,只需要针对该页面集合中的页面,对访问的次数进行简单叠加即可,不需要进行对比和排重处理。
步骤203、确定获取的终端数量与次数的比值。该比值可以是终端数量除以次数得到的比值,也可以是次数除以终端数量得到的比值。
优选的,当上述步骤201和步骤202中,分别获取了多个历史时间段内访问页面集合中的页面的终端数量,以及该多个历史时间段内该页面集合中的页面被访问的次数时,本步骤中,可以依次针对该多个历史时间段中的每个历史时间段,确定该历史时间段内访问该页面集合中的页面的终端数量,与该历史时间段内该页面集合中的页面被访问的次数的比值,然后,确定针对该多个历史时间段分别确定的各比值的平均值,具体见如下公式:
其中,C为本步骤中所确定的终端数量与次数的比值,即上述平均值;n为该多个历史时间段的数量;si为第i个历史时间段内访问该页面集合中的页面的终端数量,ti为第i个历史时间段内该页面集合中的页面被访问的次数。
本步骤中所确定的终端数量与次数的比值,表征了在该历史时间段内,访问页面集合中的页面的终端数量与页面集合中的页面被访问的次数的比值关系,该比值可以作为系数用于后续确定当前的一个评估时间段内访问该页面集合中的页面的终端数量。
步骤204、获取统计的评估时间段内该页面集合中的页面被访问的次数。
优选的,本步骤中也可以获取统计的多个评估时间段内该页面集合中的页面被访问的次数,例如,获取m个评估时间段内该页面集合中的页面被访问的次数,m的取值可以根据实际需要进行灵活设置,m个评估时间段可以为时间长度相同的时间段,如每个评估时间段的时间长度为一天24小时。
本步骤中所获取的评估时间段内该页面集合中的页面被访问的次数,可以是基于该评估时间段内的访问日志进行统计得到的统计结果。
评估时间段可以为当前需要确定终端数量的一个任意时间段,当该评估时间段距离该历史时间段越近时,后续所确定的结果越准确。
为了提高准确性,也可以使得该评估时间段的时间长度与该历史时间段的时间长度相同,当有该多个历史时间段时,也可以使得该评估时间段的时间长度与其中一个历史时间段的时间长度相同。
步骤205、基于确定的该比值,根据统计的该评估时间段内该页面集合中的页面被访问的次数,确定该评估时间段内访问该页面集合中的页面的终端数量。
当该比值为终端数量除以次数得到的比值时,该评估时间段内访问该页面集合中的页面的终端数量,为统计的该评估时间段内该页面集合中的页面被访问的次数乘以该比值得到的乘积;
当该比值为次数除以终端数量得到的比值时,该评估时间段内访问该页面集合中的页面的终端数量,为统计的该评估时间段内该页面集合中的页面被访问的次数除以该比值得到的商值。
优选的,当上述步骤204中是获取统计的多个评估时间段内该页面集合中的页面被访问的次数时,可以采用如下公式确定每个评估时间段内访问该页面集合中的页面的终端数量:
其中,S为每个评估时间段内访问该页面集合中的页面的终端数量,即针对多个评估时间段所确定的终端数量结果相同;m为该多个评估时间段的数量;tj为第j个评估时间段内该页面集合中的页面被访问的次数;C为上述步骤203中所确定的终端数量与次数的比值。
采用本发明实施例1提供的上述方法,不再需要对访问日志中记录的终端标识信息进行比对和排重处理,只需要统计页面被访问的次数,并基于通过历史统计结果得到的访问页面的终端数量与页面被访问的次数的比值,即可以确定评估时间段内访问页面的终端数量,从而减少了处理资源的消耗,并且提高了处理效率。
并且,虽然该方法中所确定的终端数量与实际终端数量存在一定误差,但仍能够满足对网站管理的需要。
实施例2:
图3为本发明实施例2中提供的确定访问页面的终端数量的方法的流程图,具体包括如下处理步骤:
步骤301、确定历史时间段内页面集合中的页面被访问时的各来源页面。
优选的,本步骤中可以确定多个历史时间段内页面集合中的页面被访问时的所有各来源页面,例如,确定n个历史时间段内页面集合中的页面被访问时的所有各来源页面,n的取值可以根据实际需要进行灵活设置,n个时间段可以为时间长度相同的时间段,如每个时间段的时间长度为一天24小时。
本步骤中所确定的历史时间段内页面集合中的页面被访问时的各来源页面,可以是基于该历史时间段内的访问日志进行统计得到的统计结果。
本发明实施例2中,页面集合中所包括的页面可以是一个,也可以是多个,可以根据实际需要进行灵活设置,例如,可以设置为一个网站所包括的所有页面,也可以设置为一个网站的主页面,也可以设置为一个网站的某一个栏目所对应的多个页面。
在确定各来源页面之后,可以将各来源页面之一作为指定页面,执行下述的步骤302至步骤306,也可以依次将各来源页面中的每个来源页面作为指定页面,执行下述的步骤302至步骤306。
步骤302、获取历史时间段内从该指定页面出发访问页面集合中的页面的终端数量。
优选的,当上述步骤301中,确定了多个历史时间段内页面集合中的页面被访问时的所有各来源页面时,本步骤中也可以获取该多个历史时间段内访问页面集合中的页面的终端数量。
本步骤中所获取的历史时间段内从该指定页面出发访问页面集合中的页面的终端数量,可以是按照现有技术基于该历史时间段内的访问日志进行统计得到的统计结果,也可以是按照本发明实施例提供的方法所确定的终端数量。
步骤303、获取该历史时间段内从该指定页面出发该页面集合中的页面被访问的次数。
优选的,当上述步骤302中,获取了多个历史时间段内从该指定页面出发访问页面集合中的页面的终端数量时,相应的,本步骤中也可以获取该多个历史时间段内从该指定页面出发该页面集合中的页面被访问的次数。
本步骤中所获取的该历史时间段内从该指定页面出发该页面集合中的页面被访问的次数,可以是基于该历史时间段内的访问日志进行统计得到的统计结果,在统计该次数时,只需要针对来源页面为该指定页面的访问,以及该页面集合中的页面,对访问的次数进行简单叠加即可,不需要进行对比和排重处理。
步骤304、确定获取的终端数量与次数的比值。该比值可以是终端数量除以次数得到的比值,也可以是次数除以终端数量得到的比值。
优选的,当上述步骤302和步骤303中,分别获取了多个历史时间段内从该指定页面出发访问页面集合中的页面的终端数量,以及该多个历史时间段内从该指定页面出发该页面集合中的页面被访问的次数时,本步骤中,可以依次针对该多个历史时间段中的每个历史时间段,确定该历史时间段内从该指定页面出发访问该页面集合中的页面的终端数量,与该历史时间段内从该指定页面出发该页面集合中的页面被访问的次数的比值,然后,确定针对该多个历史时间段分别确定的各比值的平均值,具体见如下公式:
其中,C为本步骤中所确定的终端数量与次数的比值,即上述平均值;n为该多个历史时间段的数量;si为第i个历史时间段内从该指定页面出发访问该页面集合中的页面的终端数量,ti为第i个历史时间段内从该指定页面出发该页面集合中的页面被访问的次数。
本步骤中所确定的终端数量与次数的比值,表征了在该历史时间段内,从该指定页面出发访问页面集合中的页面的终端数量与从该指定页面出发页面集合中的页面被访问的次数的比值关系,该比值可以作为系数用于后续确定当前的一个评估时间段内从该指定页面出发访问该页面集合中的页面的终端数量。
步骤305、获取统计的评估时间段内从该指定页面出发该页面集合中的页面被访问的次数。
优选的,本步骤中也可以获取统计的多个评估时间段内从该指定页面出发该页面集合中的页面被访问的次数,例如,获取m个评估时间段内从该指定页面出发该页面集合中的页面被访问的次数,m的取值可以根据实际需要进行灵活设置,m个评估时间段可以为时间长度相同的时间段,如每个评估时间段的时间长度为一天24小时。
本步骤中所获取的评估时间段内从该指定页面出发该页面集合中的页面被访问的次数,可以是基于该评估时间段内的访问日志进行统计得到的统计结果。
评估时间段可以为当前需要确定终端数量的一个任意时间段,当该评估时间段距离该历史时间段越近时,后续所确定的结果越准确。
为了提高准确性,也可以使得该评估时间段的时间长度与该历史时间段的时间长度相同,当有该多个历史时间段时,也可以使得该评估时间段的时间长度与其中一个历史时间段的时间长度相同。
步骤306、基于确定的该比值,根据统计的该评估时间段内从该指定页面出发该页面集合中的页面被访问的次数,确定该评估时间段内从该指定页面出发访问该页面集合中的页面的终端数量。
当该比值为终端数量除以次数得到的比值时,该评估时间段内从该指定页面出发访问该页面集合中的页面的终端数量,为统计的该评估时间段内从该指定页面出发该页面集合中的页面被访问的次数乘以该比值得到的乘积;
当该比值为次数除以终端数量得到的比值时,该评估时间段内从该指定页面出发访问该页面集合中的页面的终端数量,为统计的该评估时间段内从该指定页面出发该页面集合中的页面被访问的次数除以该比值得到的商值。
优选的,当上述步骤305中是获取统计的多个评估时间段内从该指定页面出发该页面集合中的页面被访问的次数时,可以采用如下公式确定每个评估时间段内从该指定页面出发访问该页面集合中的页面的终端数量:
其中,S为每个评估时间段内从该指定页面出发访问该页面集合中的页面的终端数量,即针对多个评估时间段所确定的终端数量结果相同;m为该多个评估时间段的数量;tj为第j个评估时间段内从该指定页面出发该页面集合中的页面被访问的次数;C为上述步骤304中所确定的终端数量与次数的比值。
采用本发明实施例2提供的上述方法,不再需要对访问日志中记录的终端标识信息进行比对和排重处理,只需要统计页面被访问的次数,并基于通过历史统计结果得到的访问页面的终端数量与页面被访问的次数的比值,即可以确定评估时间段内从该指定页面出发访问页面的终端数量,从而减少了处理资源的消耗,并且提高了处理效率。
本发明实施例中,当在上述步骤301中将各来源页面之一作为指定页面时,还可以记录评估时间段内从该来源页面出发访问页面集合中的页面的终端数量;
当在上述步骤301中依次将各来源页面中的每个来源页面作为指定页面时,还可以依次针对每个来源页面记录评估时间段内从该来源页面出发访问页面集合中的页面的终端数量,具体可以将与各来源页面分别对应的确定结果保存到一张统计表内,从而能够获得该集合页面中的页面被访问时的终端来源的构成情况。
实施例3:
基于同一发明构思,根据本发明上述实施例提供的确定访问页面的终端数量的方法,相应地,本发明实施例3还提供了一种确定访问页面的终端数量的装置,其结构示意图如图4所示,具体包括:
获取单元401,用于获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数;
第一确定单元402,用于确定所述终端数量与所述次数的比值;
第二确定单元403,用于基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量。
进一步的,获取单元401,具体用于获取多个历史时间段内访问页面集合中的页面的终端数量,以及所述多个历史时间段内所述页面集合中的页面被访问的次数;
第一确定单元402,具体用于依次针对所述多个历史时间段中的每个历史时间段,确定该历史时间段内访问所述页面集合中的页面的终端数量,与该历史时间段内所述页面集合中的页面被访问的次数的比值;并确定针对所述多个历史时间段分别确定的各比值的平均值。
进一步的,获取单元401,具体用于获取历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数;
第二确定单元403,具体用于基于所述比值,根据统计的评估时间段内从所述指定页面出发所述页面集合中的页面被访问的次数,确定所述评估时间段内从所述指定页面出发访问所述页面集合中的页面的终端数量。
进一步的,获取单元401,具体用于获取多个历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述多个历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数;
第一确定单元402,具体用于依次针对所述多个历史时间段中的每个历史时间段,确定该历史时间段内从指定页面出发访问所述页面集合中的页面的终端数量,与该历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数的比值;并确定针对所述多个历史时间段分别确定的各比值的平均值。
进一步的,上述装置,还包括:
页面确定单元404,用于确定所述历史时间段内页面集合中的页面被访问时的各来源页面;
记录单元405,用于将所述各来源页面之一作为所述指定页面,并记录所述评估时间段内从该来源页面出发访问所述页面集合中的页面的终端数量;或者,依次将所述各来源页面中的每个来源页面作为所述指定页面,并针对每个来源页面记录所述评估时间段内从该来源页面出发访问所述页面集合中的页面的终端数量。
上述各单元的功能可对应于图1至图3所示流程中的相应处理步骤,在此不再赘述。
综上所述,本发明实施例提供的方案,包括:获取历史时间段内访问页面集合中的页面的终端数量,以及该历史时间段内该页面集合中的页面被访问的次数;并确定获取的该终端数量与该次数的比值;以及基于确定的该比值,根据统计的评估时间段内该页面集合中的页面被访问的次数,确定该评估时间段内访问该页面集合中的页面的终端数量。采用本发明实施例提供的方案,减少了确定访问页面的终端数量时消耗的处理资源,并提高了处理效率。
本申请的实施例所提供的装置可通过计算机程序实现。本领域技术人员应该能够理解,上述的模块划分方式仅是众多模块划分方式中的一种,如果划分为其他模块或不划分模块,只要该装置具有上述功能,都应该在本申请的保护范围之内。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种确定访问页面的终端数量的方法,其特征在于,包括:
获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数;
确定所述终端数量与所述次数的比值;
基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量;
其中,基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量,具体包括:
当所述比值为终端数量除以次数得到的比值时,确定所述评估时间段内访问所述页面集合中的页面的终端数量,为统计的所述评估时间段内所述页面集合中的页面被访问的次数乘以所述比值得到的乘积;当所述比值为次数除以终端数量得到的比值时,确定所述评估时间段内访问所述页面集合中的页面的终端数量,为统计的所述评估时间段内所述页面集合中的页面被访问的次数除以所述比值得到的商值。
2.如权利要求1所述的方法,其特征在于,获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数,具体包括:
获取多个历史时间段内访问页面集合中的页面的终端数量,以及所述多个历史时间段内所述页面集合中的页面被访问的次数;
确定所述终端数量与所述次数的比值,具体包括:
依次针对所述多个历史时间段中的每个历史时间段,确定该历史时间段内访问所述页面集合中的页面的终端数量,与该历史时间段内所述页面集合中的页面被访问的次数的比值;
确定针对所述多个历史时间段分别确定的各比值的平均值。
3.如权利要求1所述的方法,其特征在于,获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数,具体包括:
获取历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数;
基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量,具体为:
基于所述比值,根据统计的评估时间段内从所述指定页面出发所述页面集合中的页面被访问的次数,确定所述评估时间段内从所述指定页面出发访问所述页面集合中的页面的终端数量。
4.如权利要求3所述的方法,其特征在于,获取历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数,具体包括:
获取多个历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述多个历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数;
确定所述终端数量与所述次数的比值,具体包括:
依次针对所述多个历史时间段中的每个历史时间段,确定该历史时间段内从指定页面出发访问所述页面集合中的页面的终端数量,与该历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数的比值;
确定针对所述多个历史时间段分别确定的各比值的平均值。
5.如权利要求3或4所述的方法,其特征在于,还包括:
确定所述历史时间段内页面集合中的页面被访问时的各来源页面;
将所述各来源页面之一作为所述指定页面,并记录所述评估时间段内从该来源页面出发访问所述页面集合中的页面的终端数量;或者,依次将所述各来源页面中的每个来源页面作为所述指定页面,并针对每个来源页面记录所述评估时间段内从该来源页面出发访问所述页面集合中的页面的终端数量。
6.一种确定访问页面的终端数量的装置,其特征在于,包括:
获取单元,用于获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数;
第一确定单元,用于确定所述终端数量与所述次数的比值;
第二确定单元,用于基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量;
其中,所述第二确定单元,具体用于当所述比值为终端数量除以次数得到的比值时,确定所述评估时间段内访问所述页面集合中的页面的终端数量,为统计的所述评估时间段内所述页面集合中的页面被访问的次数乘以所述比值得到的乘积;当所述比值为次数除以终端数量得到的比值时,确定所述评估时间段内访问所述页面集合中的页面的终端数量,为统计的所述评估时间段内所述页面集合中的页面被访问的次数除以所述比值得到的商值。
7.如权利要求6所述的装置,其特征在于,所述获取单元,具体用于获取多个历史时间段内访问页面集合中的页面的终端数量,以及所述多个历史时间段内所述页面集合中的页面被访问的次数;
所述第一确定单元,具体用于依次针对所述多个历史时间段中的每个历史时间段,确定该历史时间段内访问所述页面集合中的页面的终端数量,与该历史时间段内所述页面集合中的页面被访问的次数的比值;并确定针对所述多个历史时间段分别确定的各比值的平均值。
8.如权利要求6所述的装置,其特征在于,所述获取单元,具体用于获取历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数;
所述第二确定单元,具体用于基于所述比值,根据统计的评估时间段内从所述指定页面出发所述页面集合中的页面被访问的次数,确定所述评估时间段内从所述指定页面出发访问所述页面集合中的页面的终端数量。
9.如权利要求8所述的装置,其特征在于,所述获取单元,具体用于获取多个历史时间段内从指定页面出发访问页面集合中的页面的终端数量,以及所述多个历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数;
所述第一确定单元,具体用于依次针对所述多个历史时间段中的每个历史时间段,确定该历史时间段内从指定页面出发访问所述页面集合中的页面的终端数量,与该历史时间段内从所述指定页面出发所述页面集合中的页面被访问的次数的比值;并确定针对所述多个历史时间段分别确定的各比值的平均值。
10.如权利要求8或9所述的装置,其特征在于,还包括:
页面确定单元,用于确定所述历史时间段内页面集合中的页面被访问时的各来源页面;
记录单元,用于将所述各来源页面之一作为所述指定页面,并记录所述评估时间段内从该来源页面出发访问所述页面集合中的页面的终端数量;或者,依次将所述各来源页面中的每个来源页面作为所述指定页面,并针对每个来源页面记录所述评估时间段内从该来源页面出发访问所述页面集合中的页面的终端数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310001451.2A CN103095820B (zh) | 2013-01-04 | 2013-01-04 | 一种确定访问页面的终端数量的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310001451.2A CN103095820B (zh) | 2013-01-04 | 2013-01-04 | 一种确定访问页面的终端数量的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103095820A CN103095820A (zh) | 2013-05-08 |
CN103095820B true CN103095820B (zh) | 2016-03-16 |
Family
ID=48207943
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310001451.2A Active CN103095820B (zh) | 2013-01-04 | 2013-01-04 | 一种确定访问页面的终端数量的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103095820B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106484819A (zh) * | 2016-09-26 | 2017-03-08 | 天脉聚源(北京)科技有限公司 | 一种统计用户量的方法及装置 |
CN107277118B (zh) * | 2017-05-31 | 2020-06-30 | 北京京东尚科信息技术有限公司 | 生成节点的常用访问路径的方法和装置 |
CN108280024B (zh) * | 2017-12-29 | 2021-06-22 | 五八有限公司 | 流量分配策略测试方法、装置及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101399848A (zh) * | 2008-09-01 | 2009-04-01 | 腾讯科技(深圳)有限公司 | 针对网页广告进行带宽流量预测的系统及方法 |
CN102681999A (zh) * | 2011-03-08 | 2012-09-19 | 阿里巴巴集团控股有限公司 | 一种用户行为信息收集及信息发送方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5334987B2 (ja) * | 2007-12-10 | 2013-11-06 | グーグル・インコーポレーテッド | テレビ放送のトラフィック推定 |
-
2013
- 2013-01-04 CN CN201310001451.2A patent/CN103095820B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101399848A (zh) * | 2008-09-01 | 2009-04-01 | 腾讯科技(深圳)有限公司 | 针对网页广告进行带宽流量预测的系统及方法 |
CN102681999A (zh) * | 2011-03-08 | 2012-09-19 | 阿里巴巴集团控股有限公司 | 一种用户行为信息收集及信息发送方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103095820A (zh) | 2013-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bülbül et al. | Taylor polynomial solution of hyperbolic type partial differential equations with constant coefficients | |
Feng et al. | Storage life prediction for a high-performance capacitor using multi-phase Wiener degradation model | |
CN111563368A (zh) | 报表生成方法、装置、计算机设备和存储介质 | |
Dai | Quadratic entropy of uncertain variables | |
CN103150238A (zh) | 一种服务请求处理方法、模拟性能测试方法及装置 | |
Chen et al. | Uncertainty quantification for monotone stochastic degradation models | |
CN103714004A (zh) | Jvm在线内存泄露分析方法及系统 | |
Li et al. | Nonparametric multivariate CUSUM control charts for location and scale changes | |
JP2019512126A (ja) | 機械学習システムをトレーニングする方法及びシステム | |
CN109309596A (zh) | 一种压力测试方法、装置及服务器 | |
Hüsler et al. | Estimation for the generalized Pareto distribution using maximum likelihood and goodness of fit | |
Liu et al. | Understanding and addressing the unbounded “likelihood” problem | |
CN104598539A (zh) | 一种互联网事件热度计算方法及终端 | |
CN104820663A (zh) | 发现低性能的sql语句以及预测sql语句性能的方法和装置 | |
CN103095820B (zh) | 一种确定访问页面的终端数量的方法及装置 | |
CN108197338B (zh) | 一种浏览器书签生成方法、系统及终端设备 | |
CN103605756A (zh) | 用于联机分析处理的数据处理方法和装置 | |
Guo et al. | Probability approximation schemes for stochastic programs with distributionally robust second-order dominance constraints | |
Yang et al. | Asymptotics for randomly weighted and stopped dependent sums | |
CN103530390A (zh) | 网页抓取的方法及设备 | |
Li et al. | On a ruin model with both interclaim times and premiums depending on claim sizes | |
Stolletz et al. | Time-dependent performance evaluation for loss-waiting queues with arbitrary distributions | |
Liu et al. | Grey-based approach for estimating Weibull model and its application | |
JP2016024486A (ja) | データ活用システム及びその制御方法 | |
CN103530392A (zh) | 确定抓取流量的方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230417 Address after: Room 501-502, 5/F, Sina Headquarters Scientific Research Building, Block N-1 and N-2, Zhongguancun Software Park, Dongbei Wangxi Road, Haidian District, Beijing, 100193 Patentee after: Sina Technology (China) Co.,Ltd. Address before: 100080, International Building, No. 58 West Fourth Ring Road, Haidian District, Beijing, 20 floor Patentee before: Sina.com Technology (China) Co.,Ltd. |
|
TR01 | Transfer of patent right |