CN104182801B - 一种预测网站访问量的方法及设备 - Google Patents
一种预测网站访问量的方法及设备 Download PDFInfo
- Publication number
- CN104182801B CN104182801B CN201310192817.9A CN201310192817A CN104182801B CN 104182801 B CN104182801 B CN 104182801B CN 201310192817 A CN201310192817 A CN 201310192817A CN 104182801 B CN104182801 B CN 104182801B
- Authority
- CN
- China
- Prior art keywords
- duration
- visit capacity
- time period
- prediction
- benchmark
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种预测网站访问量的方法及设备,利用已发生过的第一时长内实际访问量和基准访问量之间的实际偏移率作为预测依据,动态修正还未发生的第二时长内的基准访问量,预测得到第二时长内的参考访问量,使得预测的第二时长内的参考访问量更加符合当前的实际情况,提高参考访问量的预测准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种预测网站访问量的方法及设备。
背景技术
随着互联网技术的不断发展,越来越多的业务都在线上执行,相应的,网站的访问量也逐渐增加。如网络购票业务、在线报名业务、在线阅读业务、在线购物业务执行时等,相应的网站需承担大量的访问量。特别是在一些特殊时期,网站的访问量将会出现明显的增长和波动。例如,在节假日前夕,网络购票网站的访问量会出现大幅增加;再例如,在购物网站的促销活动或抽奖活动期间,购物网站的访问量也会出现明显增加;甚至于网站通过搜索竞价排名或外投广告的方式引入访问的情况下,网站的访问量在一定时期内会出现大幅增量。
终端对网站的访问过程实际是对服务器的访问过程,网站能够承担的访问量是由网站内设置的服务器数量决定的。由于单台服务器能够承担的访问量是有限的,因此,在估计网站的访问量将会出现明显增加的情况下,网站维护人员需预先对服务器进行扩容,即增加网站内设置的服务器数量,或扩充服务器存储空间的容量。例如,购物网站在一段时间内将进行促销活动,需预估在这段时间内的访问量,特别是估计出相对于平时状态下增加的访问量,从而确定出需要增加的服务器数量,将增加的服务器数量提前部署上线,以确保在促销活动期间,能够满足终端的访问需求。
以上通过预估访问量来对服务器进行扩容的方式在一定程度上可以克服增加的访问量对网站造成的访问压力,但是,这种方式的缺点在于预估的访问量往往不太准确,如果访问量的估计过高,部署过量的服务器会造成服务器资源的浪费,降低服务器的资源利用率;如果访问量估计过低,部署的服务器数量不够,当访问量迅速增加时,又会造成终端无法正常访问网站的问题,出现线上报警,即使临时增加服务器,会对服务器的维护造成压力。
综上所述,由于目前扩容后的服务器数量不一定能够与实际的访问量适配的问题是因为对访问量的预估不准确所导致的,因此,亟待找到一种能够较为准确、实时地预估网站访问量的方式。
发明内容
本申请实施例提供了一种预测网站访问量的方法和设备,用以解决现有技术中存在的对网站的访问量预估不准确的问题。
一种预测网站访问量的方法,所述方法包括:
根据已发生的第一时长内实际访问量与基准访问量之间的实际偏移率,确定还未发生的第二时长的预测偏移率;
根据第二时长的预测偏移率和在第二时长内的基准访问量,预测在第二时长内的参考访问量。
一种预测网站访问量的设备,所述设备包括:
偏移率确定模块,用于确定已发生的第一时长内实际访问量与基准访问量之间的实际偏移率,以及根据第一时长的实际偏移率确定还未发生的第二时长的预测偏移率;
参考访问量预测模块,用于根据所述第二时长的预测偏移率和在第二时长内的基准访问量,预测在第二时长内的参考访问量。
本申请有益效果如下:
本申请实施例利用已发生过的第一时长内实际访问量和基准访问量之间的实际偏移率作为预测依据,不断动态修正还未发生的第二时长内的基准访问量,使得对基准访问量修正后得到的第二时长内的参考访问量更加符合实际情况,提高参考访问量的预估准确性。
附图说明
图1为本实施例一中得到基准访问量的方法步骤示意图;
图2为本申请实施例一中在24小时内的访问量分布比例示意图;
图3为本申请实施例二中预测网站访问量的方法步骤示意图;
图4为本申请实施例三中预测网站访问量的设备的结构示意图;
图5为利用本申请实施例三的预测网站访问量的设备来自动增、减服务器数量的系统架构示意图。
具体实施方式
为了准确、实时地预估网站的访问量,本申请实施例的方案利用已发生过的第一时长内实际访问量和基准访问量之间的实际偏移率作为预测依据,动态修正还未发生的第二时长内的基准访问量,修正后得到第二时长内的参考访问量,使得预估的第二时长内的参考访问量更加符合当前的实际情况,提高参考访问量的预估准确性。之后,可利用预估的参考访问量对服务器的扩容数量或服务器的存储空间扩容进行更为准确的判断,同时,还可利用预估的参考访问量对网站的业务功能进行实时调整。
本申请各实施例中涉及的历史访问量是通过对网站在正常运行的一段较长时间内的运行状态自学习或是对网站的日志信息统计后得到的。
本申请各实施例中涉及的基准访问量是指初步估计出的访问量。
本申请各实施例中涉及的实际访问量是实际发生过的访问量。
本申请各实施例中涉及的参考访问量是对基准访问量进行修正后较为准确的预估访问量。
下面结合具体实施例对本申请的方案进行详细说明,但本申请并不局限于以下实施例。
由于本申请实施例的方案是对初步估计的基准访问量的动态修正,因此,本申请实施例的方案中包括初步估计得到基准访问量的过程和动态修正基准访问量后预测得到参考访问量的过程,下面分别通过实施例一和实施例二加以说明。
实施例一:
如图1所示,为本实施例一中对访问量进行初步估计得到基准访问量的方法步骤示意图,所述方法包括以下步骤:
步骤101:确定单位时长内的访问量分布比例。
由于不同的网站具有不同的业务特点,因此,针对某一网站而言,对该网站的访问量具有与该网站的业务特点相应的波动性,在单位时长内访问量的分布并不是均匀的,而这种分布具有相对的趋势稳定性和周期性,所述单位时长可视为访问量分布的趋势稳定性的周期时长。
例如,针对购物网站而言,每天上午10点左右和晚上9点左右是访问量高峰期,也就是说,购物网站的访问量分布的周期是1天(可设定为所述单位时长是1天)。在每天的相同时间段内,访问量的波动特点很相近,在一个单位时长内访问量的波动特点可用访问量分布比例来反映,如图2所示,为某业务在单位时长(24小时)内访问量分布比例的示意图。
访问量分布比例的具体算法为:
第一步:将所述单位时长划分为至少一个时间段,如图2所示,将单位时长划分为24个时间段,每个时间段为1小时。
将单位时长划分为多个时间段后,在每一个时间段开始时执行实施例二中预测网站的参考访问量的方案。当然,本实施例也不限于通过其他手段触发实施例二中预测网站的参考访问量的方案开始执行,如由管理员手动触发或是事件触发等。
第二步:通过对网站运行状态的自学习或是对网站日志信息的统计,确定在单位时长内的历史访问量和每个时间段的历史访问量。
第三步:针对每个时间段,计算该时间段的历史访问量与单位时长内的历史访问量之间的比例。
例如:单位时长为10小时,每个时间段的长度为1小时,依次计算得到的访问量分布比例如表1所示:
表1
为了使得到的访问量分布比例更加准确,可对单位时长内的历史访问量和每个时间段的历史访问量进行多次统计,并对每次统计得到的各时间段的比例取平均,作为最终计算出的各时间段的历史访问量与单位时长内的历史访问量之间的比例。
第四步:统计计算出的各时间段的比例,得到在单位时长内的访问量分布比例。
另外,网站内诸如促销活动等引起网站的访问量出现大幅增加或波动的整个过程将会是一个持续时间,即:相对于一般状态下需要对大量增加的访问量进行保障的持续时间。所述持续时间可以是12小时、1天或长期运行。由于单位时间内相同时间段的访问量分布比例是相对稳定的,因此,在确定单位时长内的访问量分布比例时,就可以确定在整个持续时间内的访问量分布比例,简化本实施例的方案。假设:促销活动的持续时间为3天,则在每天的上午10点至11点期间的访问量比例是相对稳定的,因此,在整个3天的持续时间内以1天为单位时长,每一个单位时长内的访问量分布比例相同,可简化本实施例的方案。
步骤102:预估单位时长内的总访问量。
本步骤102是对单位时长内的总访问量做初步估计,这里的估计方式与现有技术中为服务器扩容而进行的访问量估计方式相同。
步骤103:根据预估的单位时长内总访问量和单位时长内每个时间段的访问量分布比例,分别确定每个时间段内的基准访问量。
由于在一个单位时长内,基准访问量是变化的,因此,可将单位时长划分为更短的时间段,针对每一时间段确定相应的基准访问量,可以使基准访问量更加准确,接近实际状态。
单位时长划分后的时间段数量越多,即每个时间段越短,预测的频度就越高,结果就越准确,但如果时间段划分过多,又会引起运算量过大的问题,因此,可综合考虑准确性和运算量,选择合理的时间段长度。例如,一个单位时长是24小时,则可将单位时长划分为24个时间段,每个时间段长度为1小时。
由于在步骤101中确定了每个时间段的访问量分布比例,即该时间段内的访问量与整个单位时长内访问量的比值,因此,一个时间段的访问量分布比例与单位时长内预估的总访问量之积为该时间段内初步预估的访问量,本实施例一的方案中称之为基准访问量。
仍以表1所示的情况为例,假设单位时长内预估的总访问量为100万次,得到每个时间段内的基准访问量如表2所示:
表2
以时间段1的访问量分布比例为例,时间段1的访问量分布比例是6%,表示上午8点这一个小时内的访问量占整个10小时访问量的6%,当预估的总访问量为100万次时,时间段1内的基准访问量60000次。
通过本实施例一的方案,预估出单位时长内每个时间段的基准访问量,此时确定出的基准访问量的准确性不高,需经实施例二对本实施例一的基准访问量进行修正,进而估计出准确性较高的参考访问量。
实施例二:
如图3所示,为本实施例二中预测网站访问量的方法步骤示意图,所述方法包括以下步骤:
步骤201:确定已发生的第一时长内实际访问量与基准访问量之间的实际偏移率。
所述实际偏移率=(实际访问量/基准访问量)-1,若实际该偏移率为正数,表示实际访问量大于基准访问量;若该实际偏移率为零,表示实际访问量等于基准访问量;若该实际偏移率为负数,表示实际访问量小于基准访问量。
本实施例中涉及的实际偏移率是用于表示实际访问量与基准访问量之间偏差的参数,所述实际偏移率也不限于利用其它能够反映实际访问量与基准访问量之间片段的算法确定。
第一时长内的基准访问量可由实施例一的方案确定。
由于第一时长是已发生过的,因此,第一时长内的实际访问量可通过对第一时长内生成的日志信息统计确定,当然,本实施例也不限于其他方式确定已发生过的第一时长内的实际访问量。
在本实施例二中涉及的第一时长是指单位时长内已发生过的一段时长,该第一时长可以为单位时长内的一个时间段,也可以包括单位时长内的多个时间段。
在第一时长为一个时间段时,该时间段的实际访问量与基准访问量之间的实际偏移率即为第一时长的实际偏移率。
在第一时长包括多个时间段时,需根据每个时间段内的实际访问量与基准访问量,分别确定每个时间段内的实际偏移率。
例如:在表2所示的情况下,若当前时间是上午10点,表示时间段1和时间段2已发生过,若第一时长包括时间段1和时间段2,可根据每个时间段内的实际访问量与基准访问量,分别确定每个时间段内的实际偏移率,得到表3:
表3
步骤202:根据第一时长的实际偏移率确定还未发生的第二时长的预测偏移率。
本步骤201中涉及的第一时长是单位时长内已发生的时长,本步骤202中涉及的第二时长是单位时长内还未发生的时长。
在本步骤202的方案中,利用已发生的第一时长的实际偏移率来估计还未发生的第二时长的预测偏移率,第一时长的实际偏移率越大,则第二时长的预测偏移率也越大。第一时长与第二时长在时间上越接近,第一时长的实际偏移率大小对第二时长的预测偏移率影响越大。
仍以表3所示的情况为例,在确定第一时长内的时间段1和时间段2的实际偏移率后,通过对两个实际偏移率移动加权平均的算法,得到相邻的第二时长的偏移率。
在本实施例二的方案中,可设定:与第二时长越接近的时间段配置的加权值越大。仍以表3所示的情况为例,假设第一时长内包括时间段1和时间段2,第二时长包括时间段3,时间段2与时间段3最接近,设定时间段2的加权值为1,时间段1的加权值为0.95,并通过以下公式(1)计算出第二时长的预测偏移率:
(1)
其中:表示第二时长的预测偏移率;xi表示已经发生的前第i个时间段的实际访问次数;Yi表示已经发生的前第i个时间段的基准访问次数;表示已经发生的前第i个时间段的实际偏移率;Wi表示已经发生的前第i个时间段的加权值。
除了上述方式设置加权值外,如果对于某些业务而言,时间远近对数据影响的差异较小时,也可简单化处理,为每个已发生的时间段设置相同的权重。
步骤203:根据第二时长的预测偏移率和在第二时长内的基准访问量,预测第二时长内的参考访问量。
第二时长的预测偏移率是对第二时长的基准访问量进行修正的依据,据此可较为精确地估计出第二时长内的参考访问量,进而可根据估计出的参考访问量对第二时长内的服务器数量或服务器存储空间进行预估或对网站的业务功能进行实时调整。
在步骤202中的第二时长可以为一个时间段,也可以包括多个时间段,针对不同的情况,本步骤203的执行方式也有所不同,仍以表3所示的情况为例,下面分别加以说明:
情况一:若第二时长为时间段3,则通过公式(1)的计算后,在表3中增加时间段3的预测偏移率和参考访问次数,如表4所示。
表4
在时间段3发生后,根据时间段3内的实际访问量计算出时间段3的实际偏移率,进而可利用时间段1、时间段2、时间段3这个已发生的时间段的实际偏移率结合公式(1)计算还未发生的时间段4的预测偏移率,并预测出时间段4的参考访问量,以此类推,随着时间的推移,不断地利用已发生时间段的相关信息计算还未发生时间段的预测偏移率,以及预测还未发生时间段的参考访问量。
情况二:若第二时长包括多个时间段时,可将公式(1)的计算结果作为所述多个时间段中第一个时间段的预测偏移率。例如,第二时长包括时间段3和时间段4时,则可将公式(1)的计算结果作为时间段3的预测偏移率,进而预估出时间段3的参考访问量,仍得到表4所示的结果。
情况三:若第二时长包括多个时间段时,可将公式(1)的计算结果作为所述多个时间段中前N个时间段的预测偏移率,所述N为大于1的正整数,且不大于第二时长内包括的时间段的数量,N的取值可根据实际需求选定。例如,第二时长包括时间段3和时间段4,可将公式(1)的计算结果同时作为时间段3和时间段4的预测偏移率,进而预估出时间段3和时间段4的参考访问量,得到表5所示的结果。
表5
在上述表5所示的情况下,利用已发生的时间段1和时间段2的实际偏移率,不仅可以对相邻的时间段3的基准访问量进行修正,还可以对之后的时间段4的基准访问量进行修正,这样做的好处是:能够对时间段3参考访问量做较为准确预估,同时还可以对更往后的时间段4更早地进行预测,虽然预测准确性相对于时间段3会有所下降,但相比较于实施例一得到的基准访问量,一方面预测出的时间段4的参考访问量更加准确,另一方面对时间段4的参考访问量提前预测可以对访问量趋势更早地预警。
本实施例二的方案将在引起网站的访问量出现大幅增加或波动的整个持续时间循环执行,例如,在得到表4所示的结果后,等待时间段3的发生,之后,可利用已发生的时间段1、时间段2和时间段3(视为步骤201中的第一时长)的实际偏移率计算出时间段4的预测偏移率,进而对时间段4的基准访问量进行修正,得到时间段4的参考访问量。以此类推,在时间段10发生后,本次单位时长已全部发生,可等待下一单位时长的到来,即第二天的上午8点。
在持续时间内有多个单位时长时,某一单位时长内的一个时间段的预测偏移率可依据已发生过的所有时间段的实际偏移率确定,例如,网站内促销活动将持续3天,单位时长为1天,每个时间段为1小时。在第一天结束时,可将第一天内24个时间段的实际偏移率进行公式(1)计算后,得到第二天的时间段1的预测偏移率。
除此之外,在本实施例的方案中,也不限于某一单位时长内一个时间段的预测偏移率依据之前的最后若干个时间段的实际偏移率确定。例如,例网站内促销活动将持续3天,单位时长为1天,每个时间段为1小时。在第一天结束时,第二天的时间段1的预测偏移率可依据第一天的最后若干个时间段的实际偏移率(如时间段20、时间段21、时间段22、时间段23和时间段24的实际偏移率)进行公式(1)计算后确定。
利用本申请实施例一和实施例二的方案对基准访问量进行修正后,实时预测得到的参考访问量更加贴近实际情况,由于针对还未发生的每一时长都是实时利用最近发生数据作为其基准访问量的修正依据,而且随着已发生的时长不断变长,可作为修正依据的数据增加,不断的修正过程能够保证对还未发生时长的参考访问量较为准确的预估。
实施例三:
与本实施例一和实施例二属于同一发明构思下的,本实施例三还提供一种确定网站访问量的设备,如图4所示,该设备包括配置部件和动态预测部件,下面分别加以说明:
配置部件可由管理员预先静态配置,主要配置的内容有:
(1)、持续时间,如网站内诸如促销活动等引起网站的访问量出现大幅增加或波动的整个过程的开始时间和结束时间。这里的持续时间与实施例一中涉及的持续时间的含义以及取值方式相同。
(2)、单位时长内每个时间段的长度,这里的时间段长度与实施例一中涉及的时间段长度相同。
(3)、每个时间段的访问量分布比例,这里的访问量分布比例与实施例一中确定的访问量分布比例相同。
(4)、单位时长内的总访问量,这里的总访问量可以按照实施例一中涉及的方案进行预估。
配置部件在配置完成上述参数后,还可触发动态预测部件开启或关闭,在触发动态预测部件开启后,动态预测部件可以在每个时间段的起始时间点到达时进行本申请实施例方案中描述的针对参考访问量的实时预测过程;在触发动态预测部件关闭后,动态预测部件将停止参考访问量的实时预测过程。
动态预测部件包括分布比例确定模块11和基准访问量预测模块12,其中:
分布比例确定模块11用于确定单位时长内每个时间段的访问量分布比例,通过运行分布比例确定模块11可得到表1所示的内容;
基准访问量预测模块12用于根据预估的单位时长内总访问量、每个时间段的访问量分布比例,分别确定每个时间段内的基准访问量,通过运行基准访问量预测模块12可得到表2所示的内容。
本实施例的方案也不限于将分布比例确定模块11和基准访问量预测模块12集成在配置部件内,以便于在动态预测部件启动前确定出单位时长内每个时间段内的基准访问量。
动态预测部件还包括偏移率确定模块13和参考访问量预测模块14,其中:
偏移率确定模块13用于确定已发生的第一时长内实际访问量与基准访问量之间的实际偏移率,以及根据第一时长的实际偏移率确定还未发生的第二时长的预测偏移率;参考访问量预测模块14用于用于根据所述第二时长的预测偏移率和在第二时长内的基准访问量,预测在第二时长内的参考访问量。
第一时长和第二时长内的基准访问量可由基准访问量预测模块12确定。
所述偏移率确定模块13具体用于在所述第一时长内包括至少一个时间段时,根据每个时间段内的实际访问量与基准访问量,分别确定每个时间段的实际偏移率。
所述偏移率确定模块13具体用于将确定的第一时长内各时间段的实际偏移率进行移动加权平均计算后,得到第二时长的预测偏移率。
在所述第二时长内包括至少一个时间段时,第二时长的预测偏移率可作为其中第一个时间段的预测偏移率,也可作为前N个时间段的偏移率,分别描述如下:
1)、偏移率确定模块13具体用于在所述第二时长内包括至少一个时间段时,将根据第一时长的实际偏移率确定得到的第二时长的预测偏移率,作为第二时长内第一个时间段的预测偏移率;参考访问量预测模块14具体用于根据第二时长内第一个时间段的预测偏移率和该第一个时间段内的基准访问量,预测在该第一个时间段内的参考访问量。
2)、偏移率确定模块13具体用于在所述第二时长内包括多个时间段时,将根据第一时长的实际偏移率确定得到的第二时长的预测偏移率,作为第二时长内前N个时间段的预测偏移率,所述N为大于1的正整数,且不大于第二时长内包括的时间段的数量;参考访问量预测模块14具体用于分别根据第二时长的前N个时间段的预测偏移率和每个时间段的基准访问量,预测第二时长内前N个时间段各自的参考访问量。
利用实施例一至实施例三的方案预测得到对还未发生时长的参考访问量后,可对网站的业务需求进行更为准确的预判,下面通过预判服务器的扩容数量和网站的抽奖活动中预判中奖概率这两种场景来进行说明。
场景一:预判服务器的扩容数量。
以表4所示的情况为例,根据预估出的时间段3的参考访问量预测出在时间段3内每秒访问次数:时间段3的每秒访问次数=87880次/3600秒=24.4次/秒。假设每台服务器每秒可响应10个访问,则需要3台服务器。如果现有服务器数量为3台,则可不作处理;若现有服务器的数量为2台,需增加1台服务器;若现有服务器的数量为4台,可空出1台服务器。
增、减服务器数量的方式包括但不限于如图5所示的系统架构:预先维护一个共享的服务器集群,该服务器集群由服务器管理设备统一管理,对各服务器进行维护。每一个服务器配置一个代理模块,用于监听服务器管理设备的指令,根据服务器管理设备的指令,在服务器内装载启动或是卸载停用针对网站需求设置的业务软件。
当利用本实施例三中所示的方案确定需要增、减服务器的数量后,可由动态预测部件通过远程调用服务器管理设备等方式,向服务器管理设备下达增、减服务器的数量以及相应业务的指令。
若该指令是空出1台针对业务A的服务器,则服务器管理设备通过远程触发代理模块,将停止运行一台服务器中的业务A,并卸载该服务器内针对业务A的业务软件,服务器可在集群中等待下一次征用。
若该指令是增加1台针对业务A的服务器,则服务器管理设备通过触发代理模块,在一台处于空闲状态的服务器内装载针对业务A的业务软件,并在该服务器上启动业务A。
在场景一下,通过实施例一和实施例二的方案自动增、减服务器的数量,不仅能提高网站应对大规模访问量的能力,提高网站的可靠性,同时能改善服务器的利用率,节约服务器资源。在需要增、减服务器的数量时,还可通过发送消息(如短信或即时通信消息)通知相关人员。
场景二:网站的抽奖活动中预判中奖概率。
仍以表4所示的情况为例,假设在10小时内要抽出2个奖品,用户的每次访问视为执行一次抽奖操作,每当一次抽奖操作完成即认为完成一次访问。通过实施例一和实施例二的方案,可预测出还未发生过的时间段内的参考访问量,即预测出还未发生过的时间段内的抽奖次数,可设定:每次抽奖的中奖概率为:剩余奖品数/预测剩余抽奖次数。
如果在10小时的单位时长间前期(如第1、第2小时)奖品没有被抽出,随着时间推移,预测剩余抽奖次数会逐渐减少,通过本申请实施例的方案可更为准确地预测剩余抽奖次数,再根据剩余奖品数动态调整中奖概率,使得分配给本单位时长的2个奖品能够尽可能地在本单位时长内抽出,不推移到下一个单位时长内,保证奖品按时间区间分布的均匀性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,所述计算机设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非持续性的电脑可读媒体(transitory media),如调制的数据信号和载波。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (11)
1.一种预测网站访问量的方法,其特征在于,所述方法包括:
根据已发生的第一时长内实际访问量与基准访问量之间的实际偏移率,确定还未发生的第二时长的预测偏移率;
根据第二时长的预测偏移率和在第二时长内的基准访问量,预测在第二时长内的参考访问量;
其中,所述第一时长和第二时长内的基准访问量是通过先确定所述第一时长在单位时长内的访问量分布比例,以及第二时长在单位时长内的访问量分布比例;然后,根据预估的单位时长内总访问量、第一时长在单位时长内的访问量分布比例和第二时长在单位时长内的访问量分布比例获得的。
2.如权利要求1所述的预测网站访问量的方法,其特征在于,在所述第一时长内包括至少一个时间段时,确定第一时长的实际偏移率,具体包括:
根据每个时间段内的实际访问量与基准访问量,分别确定每个时间段的实际偏移率。
3.如权利要求2所述的预测网站访问量的方法,其特征在于,确定第二时长的预测偏移率,具体包括:
将第一时长内各时间段的实际偏移率进行移动加权平均计算后,得到第二时长的预测偏移率。
4.如权利要求1~3任一所述的预测网站访问量的方法,其特征在于,在所述第二时长内包括至少一个时间段时,通过以下方式确定第二时长内时间段的预测偏移率:
将根据第一时长的实际偏移率确定得到的第二时长的预测偏移率,作为第二时长内第一个时间段的预测偏移率;
根据第二时长的预测偏移率和在第二时长内的基准访问量,预测在第二时长内的参考访问量,具体包括:
根据第二时长内第一个时间段的预测偏移率和该第一个时间段内的基准访问量,预测在该第一个时间段内的参考访问量。
5.如权利要求1~3任一所述的预测网站访问量的方法,其特征在于,在所述第二时长内包括至少两个时间段时,通过以下方式确定第二时长内时间段的预测偏移率:
将根据第一时长的实际偏移率确定得到的第二时长的预测偏移率,作为第二时长内前N个时间段的预测偏移率,所述N为大于1的正整数,且不大于第二时长内包括的时间段的数量;
根据第二时长的预测偏移率和在第二时长内的基准访问量,预测在第二时长内的实际访问量,具体包括:
分别根据第二时长的前N个时间段的预测偏移率和每个时间段的基准访问量,预测第二时长内前N个时间段各自的参考访问量。
6.一种预测网站访问量的设备,其特征在于,所述设备包括:
偏移率确定模块,用于确定已发生的第一时长内实际访问量与基准访问量之间的实际偏移率,以及根据第一时长的实际偏移率确定还未发生的第二时长的预测偏移率;
参考访问量预测模块,用于根据所述第二时长的预测偏移率和在第二时长内的基准访问量,预测在第二时长内的参考访问量;
分布比例确定模块,用于确定所述第一时长在单位时长内的访问量分布比例,以及第二时长在单位时长内的访问量分布比例;
基准访问量预测模块,用于根据预估的单位时长内总访问量、第一时长在单位时长内的访问量分布比例和第二时长在单位时长内的访问量分布比例,分别确定第一时长和第二时长内的基准访问量。
7.如权利要求6所述的预测网站访问量的设备,其特征在于,
偏移率确定模块,具体用于在所述第一时长内包括至少一个时间段时,根据每个时间段内的实际访问量与基准访问量,分别确定每个时间段的实际偏移率。
8.如权利要求7所述的预测网站访问量的设备,其特征在于,
偏移率确定模块,具体用于将确定的第一时长内各时间段的实际偏移率进行移动加权平均计算后,得到第二时长的预测偏移率。
9.如权利要求6~8任一所述的预测网站访问量的设备,其特征在于,
偏移率确定模块,具体用于在所述第二时长内包括至少一个时间段时,将根据第一时长的实际偏移率确定得到的第二时长的预测偏移率,作为第二时长内第一个时间段的预测偏移率;
参考访问量预测模块,具体用于根据第二时长内第一个时间段的预测偏移率和该第一个时间段内的基准访问量,预测在该第一个时间段内的参考访问量。
10.如权利要求6~8任一所述的预测网站访问量的设备,其特征在于,
偏移率确定模块,具体用于在所述第二时长内包括多个时间段时,将根据第一时长的实际偏移率确定得到的第二时长的预测偏移率,作为第二时长内前N个时间段的预测偏移率,所述N为大于1的正整数,且不大于第二时长内包括的时间段的数量;
参考访问量预测模块,具体用于分别根据第二时长的前N个时间段的预测偏移率和每个时间段的基准访问量,预测第二时长内前N个时间段各自的参考访问量。
11.一种代理服务器数量的确定方法,其特征在于,所述方法包括:
服务器管理设备获取预测服务器基于已发生的第一时长内实际访问量与基准访问量之间的实际偏移率,以及第二时长内的基准访问量上传的在第二时长内的参考访问量;
服务器管理设备基于所述参考访问量与预设的容量门限值的比值,确定接入的代理服务器的数量;
其中,所述第一时长和第二时长内的基准访问量是通过先确定所述第一时长在单位时长内的访问量分布比例,以及第二时长在单位时长内的访问量分布比例;然后,根据预估的单位时长内总访问量、第一时长在单位时长内的访问量分布比例和第二时长在单位时长内的访问量分布比例获得的。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310192817.9A CN104182801B (zh) | 2013-05-22 | 2013-05-22 | 一种预测网站访问量的方法及设备 |
HK15103132.6A HK1202689A1 (zh) | 2013-05-22 | 2015-03-27 | 種預測網站訪問量的方法及設備 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310192817.9A CN104182801B (zh) | 2013-05-22 | 2013-05-22 | 一种预测网站访问量的方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104182801A CN104182801A (zh) | 2014-12-03 |
CN104182801B true CN104182801B (zh) | 2017-06-23 |
Family
ID=51963825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310192817.9A Active CN104182801B (zh) | 2013-05-22 | 2013-05-22 | 一种预测网站访问量的方法及设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN104182801B (zh) |
HK (1) | HK1202689A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886018B (zh) * | 2014-02-21 | 2017-02-08 | 车智互联(北京)科技有限公司 | 数据预测装置、数据预测方法以及电子设备 |
CN106296247B (zh) * | 2015-05-26 | 2020-12-22 | 腾讯科技(深圳)有限公司 | 网络信息资源在线排序方法和装置 |
CN105095646A (zh) * | 2015-06-29 | 2015-11-25 | 北京京东尚科信息技术有限公司 | 数据预测方法及电子设备 |
CN105306539B (zh) * | 2015-09-22 | 2018-09-11 | 北京金山安全软件有限公司 | 业务信息展现控制方法、装置和互联网业务信息显示平台 |
CN106611023B (zh) * | 2015-10-27 | 2020-11-24 | 北京国双科技有限公司 | 网站访问异常的检测方法及装置 |
CN106685751B (zh) * | 2015-11-11 | 2019-10-25 | 北京国双科技有限公司 | 网站访问量监测方法和装置 |
CN106330754B (zh) * | 2016-08-31 | 2020-02-21 | 东软集团股份有限公司 | 访问请求的控制方法和装置 |
CN108921333B (zh) * | 2016-11-25 | 2021-04-27 | 口碑(上海)信息技术有限公司 | 一种业务量的预测方法及装置 |
CN108512711B (zh) * | 2017-02-24 | 2021-07-13 | 阿里巴巴(中国)有限公司 | 得到瞬时接口访问统计量的方法、装置和设备 |
CN111105060A (zh) * | 2018-10-26 | 2020-05-05 | 北大方正集团有限公司 | 用户搬家行为的识别方法、装置、终端及计算机存储介质 |
CN110266525B (zh) * | 2019-06-04 | 2022-02-22 | 湖北五五互联科技有限公司 | Cdn服务器数量配置方法、设备及计算机可读存储介质 |
CN110502336A (zh) * | 2019-07-05 | 2019-11-26 | 深圳壹账通智能科技有限公司 | 一种服务器的启动方法、装置、设备、及可读存储介质 |
CN112990951B (zh) * | 2019-12-12 | 2024-07-19 | 北京沃东天骏信息技术有限公司 | 确定条目访问量的方法和装置 |
CN112418951A (zh) * | 2020-12-11 | 2021-02-26 | 平安普惠企业管理有限公司 | 抽奖配置方法、装置、服务器及计算机可读存储介质 |
CN112925608B (zh) * | 2021-02-26 | 2023-05-30 | 平安付科技服务有限公司 | 基于机器学习的智能扩缩容方法、装置、设备及存储介质 |
CN114357347B (zh) * | 2021-12-28 | 2024-04-26 | 拓尔思信息技术股份有限公司 | 一种互联网文档的总访问量的估值方法 |
CN114661549B (zh) * | 2022-03-09 | 2024-04-30 | 国网山东省电力公司信息通信公司 | 基于随机森林的系统活跃度预测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262661A (zh) * | 2011-07-18 | 2011-11-30 | 南京大学 | 一种基于k阶混合马尔可夫模型的Web页面访问预测方法 |
CN102968670A (zh) * | 2012-10-23 | 2013-03-13 | 北京京东世纪贸易有限公司 | 预测数据的方法和装置 |
CN103020743A (zh) * | 2012-12-27 | 2013-04-03 | 中国科学院电工研究所 | 风电场超短期风速预测方法 |
-
2013
- 2013-05-22 CN CN201310192817.9A patent/CN104182801B/zh active Active
-
2015
- 2015-03-27 HK HK15103132.6A patent/HK1202689A1/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262661A (zh) * | 2011-07-18 | 2011-11-30 | 南京大学 | 一种基于k阶混合马尔可夫模型的Web页面访问预测方法 |
CN102968670A (zh) * | 2012-10-23 | 2013-03-13 | 北京京东世纪贸易有限公司 | 预测数据的方法和装置 |
CN103020743A (zh) * | 2012-12-27 | 2013-04-03 | 中国科学院电工研究所 | 风电场超短期风速预测方法 |
Non-Patent Citations (1)
Title |
---|
华北电网的售电量预测研究;郭锐;《中小企业管理与科技》;20071105(第9期);第73-74页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104182801A (zh) | 2014-12-03 |
HK1202689A1 (zh) | 2015-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104182801B (zh) | 一种预测网站访问量的方法及设备 | |
CN106484540B (zh) | 一种资源配置方法及装置 | |
US10785123B2 (en) | Communication network optimization | |
CN106549772B (zh) | 资源预测方法、系统和容量管理装置 | |
Lu et al. | RVLBPNN: A workload forecasting model for smart cloud computing | |
US10979914B2 (en) | Communication network optimization based on predicted enhancement gain | |
AU2020202339A1 (en) | Notifications on mobile devices | |
CN110210882A (zh) | 推广位匹配方法和装置、推广信息展示方法和装置 | |
CN106648747A (zh) | 进程预加载处理方法及装置 | |
CN104424361B (zh) | 自动定义热存储和大工作负载 | |
CN109741098A (zh) | 宽带离网预测方法、设备及存储介质 | |
CN109992473A (zh) | 应用系统的监控方法、装置、设备及存储介质 | |
CN107967173A (zh) | 一种资源调度的方法、装置和系统 | |
CN109428910A (zh) | 一种数据处理方法、装置及系统 | |
CN116645132A (zh) | 基于多因子变量的时序预测方法、装置、电子设备及介质 | |
US10846143B2 (en) | Predicting capacity of shared virtual machine resources | |
CN113934920B (zh) | 目标信息的推送方法、设备及存储介质 | |
CN112700282B (zh) | 广告投放站点的筛选方法、装置及存储介质 | |
CN111800807A (zh) | 一种基站用户数量告警的方法及装置 | |
CN111401969B (zh) | 用于提高用户留存率的方法、装置、服务器及存储介质 | |
CN110648032A (zh) | 信息更新方法和装置 | |
KR101736386B1 (ko) | 다단계 잭팟 광고 보상 서비스 제공 방법 | |
CN112187870A (zh) | 一种带宽平滑方法及装置 | |
CN110503486A (zh) | 一种广告策略的筛选方法及装置 | |
CN108416662A (zh) | 一种数据验证方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1202689 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1202689 Country of ref document: HK |