CN101534258B - 一种浮出页面的流量、会话数的调整方法和装置 - Google Patents

一种浮出页面的流量、会话数的调整方法和装置 Download PDF

Info

Publication number
CN101534258B
CN101534258B CN200910135318XA CN200910135318A CN101534258B CN 101534258 B CN101534258 B CN 101534258B CN 200910135318X A CN200910135318X A CN 200910135318XA CN 200910135318 A CN200910135318 A CN 200910135318A CN 101534258 B CN101534258 B CN 101534258B
Authority
CN
China
Prior art keywords
page
emersion
flow
jumping
total
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200910135318XA
Other languages
English (en)
Other versions
CN101534258A (zh
Inventor
冯亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN200910135318XA priority Critical patent/CN101534258B/zh
Publication of CN101534258A publication Critical patent/CN101534258A/zh
Priority to HK10102717A priority patent/HK1136122A1/xx
Application granted granted Critical
Publication of CN101534258B publication Critical patent/CN101534258B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本申请提供了浮出页面的流量、会话数的调整方法和装置,所述浮出页面的流量的调整方法包括:调整流量系统接收用户在服务器端输入的浮出页面信息,所述浮出页面信息包括浮出客户端的个数和一跳页面的网址信息;计算所述一跳页面的第一总流量,第一总流量为浮出客户端的个数和一跳页面总容量大小的乘积,一跳页面总容量大小为一跳页面的超文本链接协议HTML文件和引用对象的大小之和;获取所述浮出页面的流量峰值,当所述浮出页面的流量峰值大于Web服务器所能承受的最大值时,根据所述流量峰值调整浮出页面的流量。在本申请实施例中,可以避免Web服务器潜在的瘫痪风险,提升Web服务器的性能。

Description

一种浮出页面的流量、会话数的调整方法和装置
技术领域
本发明涉及网络数据处理领域,特别涉及浮出页面的流量、会话数的调整方法和装置。
背景技术
浮出页面可以表示在即时通讯客户端浮出的小窗口页面,浮出页面包括一跳页面、二跳页面等;一跳页面即是客户端浮出小窗口中展示的页面,一跳页面的网址可以如下所示:http://page.china.alibaba.com/shtml/alitalk/bc/alitalk_star080123.html?ifram e_delete=true,参考图1所示,为一跳页面的界面示意图;二跳页面,即是一跳页面中链接所指向的页面,用户在一跳页面浮出时,如果对其中链接的内容感兴趣,可以点击该链接并由浏览器展示该二跳页面。例如上述一跳页面中的链接“查看详情”,用户点击该链接之后,可以打开相应的二跳页面,参考图2,为二跳页面的界面示意图,网址如下所示:http://page.china.alibaba.com/loan/2009nian 1 qi.html?%20asker=atc&tracelo g=alitalk_systeminfo_mytd3
在现有技术中,在向客户端推送一跳页面之前,工作人员一般都是通过观察该一跳页面或二跳页面的显示是否正常,或者根据需要推送的客户端个数来估计一跳页面和二跳页面的链接是否会产生较大的流量,然后,再在浮出时间点由连接服务器向浮出客户端推送一跳页面网址信息,由相应的Web服务器向用户端展示一跳页面,并根据客户端的点击链接向客户端展示二跳页面;但是在推送一跳页面之前的审核都只是工作人员的估计值,当推送的客户端的个数较多,或者有多个客户端在同一时刻点击一跳页面上二跳页面的链接时,就会在Web服务器端产生较大的流量峰值,而这一点却不能被服务器端的工作人员观察得到。
从上述过程中可以看出,随着客户端个数的增多,需要多台Web服务器同时向多个客户端提供浮出页面,就会给Web服务器产生很高的并发量,再加上用户点击浮出页面中相关链接返回网站访问产生的高并发流量,就会造成流量峰值过大的结果,流量峰值指整个浮出过程中传输的最大流量值,流量峰值过大就会给Web服务器产生巨大的压力,甚至会导致部分Web服务器瘫痪;并且,一跳页面和二跳页面的引用对象中,也有可能隐藏了超大的图片或者大文件的下载链接,这时即便是一跳页面的浮出也会导致Web服务器的性能下降。
总之,目前需要本领域技术人员迫切解决的一个技术问题就是:如何能够创新的提出一种调整浮出页面的流量的方法和装置,以解决现有技术中由于无法预知浮出页面的流量峰值,就不能调整浮出页面流量从而导致的Web服务器的性能下降问题。
发明内容
本申请所要解决的技术问题是提供一种浮出页面的流量峰值的获取方法,以解决现有技术中由于无法预知浮出页面的流量峰值,就不能调整浮出页面流量从而导致的Web服务器的性能下降问题。
本申请还提供了一种浮出页面的流量的调整装置,用以保证上述方法在实际中的实现及应用。
为了解决上述问题,本申请公开了一种浮出页面的流量的调整方法,包括:
调整流量系统接收浮出页面信息,所述浮出页面信息至少包括浮出客户端的个数和一跳页面的网址信息;
调整流量系统计算所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总大小的乘积,所述一跳页面总大小为所述一跳页面的超文本链接协议HTML文件和引用对象的大小之和;
调整流量系统获取所述浮出页面的流量峰值,所述流量峰值为所述第一总流量的两倍,再除以浮出时长所得到的商;
调整流量系统判断所述浮出页面的流量峰值是否大于Web服务器所能承受的最大值,如果是,根据所述流量峰值调整浮出页面的流量。
本申请公开了一种浮出页面的流量的调整装置,该装置包括:
接收模块,用于接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数和一跳页面的网址信息;
第一计算模块,用于计算所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总容量大小的乘积,所述一跳页面总容量大小为所述一跳页面的超文本链接协议HTML文件和引用对象的大小之和;
第一获取模块,用于计算所述浮出页面的流量峰值,所述流量峰值为所述第一总流量和第二总流量之和的两倍,再除以浮出时长所得的商;
第一调整模块,用于根据浮出页面的流量峰值调整浮出页面的流量。
本申请还公开了一种浮出页面的会话数的调整方法,该方法包括:
调整会话数系统接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数和一跳页面的网址信息;
调整会话数系统计算所述一跳页面的第一总会话数,所述第一总会话数为所述浮出客户端的个数和一跳页面总请求数的乘积,所述一跳页面总请求数为所述一跳页面的引用对象的个数加一;
调整会话数系统获取所述浮出页面的会话数峰值,所述会话数峰值为所述第一总会话数的两倍,再除以浮出时长所得得到的商;
调整会话数系统判断所述会话数峰值是否大于Web服务器所能承受的最大值,如果是,根据所述会话数峰值调整浮出页面的会话数。
本申请还公开了一种浮出页面的会话数的调整装置,该装置包括:
第二接收模块,用于接收用户在服务器端输入的一跳页面信息,所述一跳页面信息包括浮出客户端的个数和一跳页面的网址信息;
第三计算模块,用于计算所述一跳页面的第一总会话数,所述第一总会话数为所述浮出客户端的个数和一跳页面总请求数的乘积,所述一跳页面总请求数为所述一跳页面的引用对象的个数加一;
第三获取模块,用于获取所述浮出页面的会话数峰值,所述会话数峰值为所述第一总会话数的两倍,再除以浮出时长得到的商;
第二调整模块,用于根据浮出页面的会话数峰值调整浮出页面的会话数。
与现有技术相比,本申请包括以下优点:
在本申请实施例中,调整流量系统通过接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数和一跳页面的网址信息;可以计算出所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总容量大小的乘积,所述一跳页面总容量大小为所述一跳页面的超文本链接协议HTML文件和引用对象的大小之和;并进一步获取所述浮出页面的流量峰值,当所述浮出页面的流量峰值大于Web服务器所能承受的最大值时,根据所述流量峰值调整浮出页面的流量。根据所述流量峰值,可以反映出在即时消息客户端进行浮出时,在Web服务器端的同一个时刻产生的并发流量,如果所述流量峰值过大或者超出了Web服务器的承受能力,则可以调整相应的浮出流量,从而对Web服务器的性能进行提升,进一步的,还可以根据不同的域名分别进行流量阈值的计算或获取,可以方便的针对不同Web服务器进行各自不同的调整。当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是现有技术中一跳页面的界面示意图;
图2是图1所示的一跳页面中链接的二跳页面的界面示意图;
图3是本申请的浮出页面的流量的调整方法在实际应用中的结构示意图;
图4是本申请的浮出页面的会话数的调整方法在实际应用中的结构示意图;
图5是本申请的一种对浮出页面的流量的调整方法实施例1的流程图;
图6是本申请浮出页面流量峰值分布的界面示意图;
图7是本申请的一种浮出页面的流量的调整方法实施例2的流程图;
图8是本申请的一种浮出页面的流量的调整方法实施例3的流程图;
图9是本申请的一种浮出页面的流量的调整方法实施例4的流程图;
图10是本申请的一种浮出页面的流量的调整装置实施例1的结构示意图;
图11是本申请的一种浮出页面的流量的调整装置实施例2的结构示意图;
图12是本申请的一种浮出页面的会话数的调整方法实施例1的流程图;
图13是本申请的一种浮出页面的会话数的调整方法实施例2的流程图;
图14是本申请的一种浮出页面的会话数的调整方法实施例3的流程图;
图15是本申请的一种浮出页面的会话数的调整装置实施例1的结构示意图;
图16是本申请的一种浮出页面的会话数的调整装置实施例2的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请在实际应用中的结构示意图可以参考图3所示,在图3中,包括调整流量系统、控制端、连接服务器、Web服务器、监控系统(图未示)以及用户端,其中,所述流量峰值系统主要用于获取当前一次推送过程需要的最大流量值;所述连接服务器和用户端相连,可以维护一个在线用户端列表,当接收到控制端发送的浮出指令时,就可以查询该在线用户端列表,以获取在线用户端的信息,并且将接收到的一跳页面URL以及具体浮出信息发送至浮出用户端,当浮出时间点到来时,由Web服务器向用户端展示一跳页面;当用户端有点击二跳页面链接的操作时,再由Web服务器向用户端展示二跳页面;其中,监控系统和Web服务器相连,用于监控所述Web服务器的当前承受能力,例如,监控系统可以实时获取当前耗用容量数据,用总容量减去当前耗用容量,即得出用于表示当前承受能力的当前可用容量,所述当前可用容量可以包括当前可用流量或当前可用会话数。
基于上述应用环境,本申请的主要思想可以包括,所述调整流量系统通过接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数和一跳页面的网址信息;可以计算出所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总容量大小的乘积,所述一跳页面总容量大小为所述一跳页面的超文本链接协议HTML文件和引用对象的大小之和;并进一步获取所述浮出页面的流量峰值,所述流量峰值为所述第一总流量的两倍,再除以浮出时长所得到的商;判断所述浮出页面的流量峰值是否大于Web服务器所能承受的最大值,当所述浮出页面的流量峰值大于Web服务器所能承受的最大值时,根据所述流量峰值来降低浮出推广的流量。
需要说明的是,本申请的主要思想在实际中的另一个应用为调整会话数系统,可以参考图4所示,为调整会话数系统在实际应用中的结构示意图,该系统可以包括:调整会话数系统、控制端、连接服务器、Web服务器、监控系统以及用户端,其中,所述流量峰值系统主要用于获取当前一次推送过程需要的最大会话数,其他的功能实体与图3中的介绍类似;所述调整会话数系统根据一跳页面的网址信息可以计算所述一跳页面的第一总会话数,所述第一总会话数为所述浮出客户端的个数和一跳页面总请求数的乘积,所述一跳页面总请求数为所述一跳页面的引用对象的个数加一;并进一步获取所述浮出页面的会话数峰值,所述会话数峰值为所述第一总会话数的两倍,再除以浮出时长所得到的商;当所述会话数峰值大于Web服务器所能承受的最大值时,根据所述会话数峰值来降低会话数。
根据本申请实施例中所述的流量峰值或者所述会话数峰值,可以反映出在即时消息客户端进行浮出时,在Web服务器端的同一个时刻产生的并发流量或者会话数,如果所述流量峰值或者会话数峰值过大或者超出了服务器的承受能力,则可以调整相应的浮出方案,从而对服务器的性能进行提升。
参考图5,示出了本申请一种浮出页面的流量的调整方法实施例1的流程图,可以包括以下步骤:
步骤501:调整流量系统接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数、二跳页面的点击率和一跳页面的网址信息;
所述浮出客户端的个数表示需要向其推送浮出页面的客户端的个数,浮出客户端的个数在不同时刻或者不同地点可以有所差异;所述浮出客户端的个数优选的,可以根据历史数据选择一定阈值时间内,例如,一个月,每一天同一个时刻出现的最高浮出客户端的个数,作为浮出客户端的个数;所述二跳页面的点击转化率表示有多少个客户端可能会点击该二跳页面的链接,点击转换率在实际中可以是5%或10%等;所述一跳页面的网址信息表示浮出对话框中引用的小页面的统一资源定位符URL;
步骤502:调整流量系统计算所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总容量大小的乘积,所述一跳页面总容量大小为所述一跳页面的超文本链接协议HTML文件和引用对象的大小之和;其中,所述引用对象是指HTML网页中引用的图片、Flash动画、JavaScript脚本、IFrame或CSS样式表等用户可见或不可见的对象;当浏览器接受到用户访问某个网页(例如http://www.alibaba.com)的用户指令时,会先抓取HTML页面源码,然后根据该页面源码中的相关语句分别抓取引用对象,以向用户端展示整个页面;根据所述一跳页面的网址信息,可以获取到该一跳页面的HTML文件,即是将该一跳页面的网址所指向的HTML页面抓取到本地,并保存为内存空间中的一个临时文件,然后用系统函数获取该临时文件的大小,即可得到所述HTML文件的大小;并同时获取到该一跳页面的引用对象的大小,例如,一跳页面中引用了图片或者音乐等,引用对象的大小即是该图片或音乐的大小,所述一跳页面总容量大小为所述一跳页面本身的HTML文件和其引用对象的大小之和;再将所述一跳页面总容量大小与所述浮出客户端的个数进行相乘,获得乘积即是所述一跳页面的第一总流量;
步骤503:调整流量系统计算所述二跳页面的第二总流量,所述第二总流量为所述浮出客户端的个数、所述点击转换率和二跳页面总容量大小的乘积,所述二跳页面总容量大小为所述二跳页面的HTML文件和引用对象的大小之和;
根据所述一跳页面的网址信息,首先获取一跳页面的HTML文件,并分析一跳页面的源码,获取源码中语句<a href=XXX>的信息,其中XXX所指代的内容便是二跳页面的链接,即是二跳页面的网址信息,然后再获取该二跳页面的HTML文件,并获取到该二跳页面的引用对象的大小,例如,二跳页面中引用了图片或者音乐等,引用对象的大小即是该图片或音乐的大小,所述二跳页面总大小为所述二跳页面本身的HTML文件和其引用对象的大小之和;再将所述二跳页面总容量大小、所述浮出客户端的个数与点击转换率乘积三者进行相乘,获得的乘积即是所述二跳页面的第二总流量;
步骤504:调整流量系统获取所述一跳页面和二跳页面的流量峰值,所述流量峰值为所述第一总流量和第二总流量之和的两倍,再除以浮出时长所得到的商。
所述流量峰值是指整个浮出过程中相关内容传输的流量最大值,在实际中,根据监控系统中记录的历史数据显示,一般浮出页面的流量趋势均符合正态分布,参考图6所示;在图6中,一次浮出的总流量近似相当于三角形的面积,即是一次浮出推广产生的所有相关流量,那么流量峰值则为图6中三角形的高,浮出时长为三角形的底,利用三角形的面积公式:三角形面积=底*高/2,可以得出流量峰值即是所述第一总流量和第二总流量之和的两倍,再除以浮出时长所得到的商。
步骤505:调整流量系统判断所述浮出页面的流量峰值是否大于Web服务器所能承受的最大值,当所述浮出页面的流量峰值大于Web服务器所能承受的最大值时,根据所述流量峰值调整浮出页面的流量。
在实际应用中,所述根据所述流量峰值调整浮出页面的流量的方法具体可以包括:缩减浮出页面文件及引用对象大小,降低浮出频率,或者分时段多批次进行浮出推广。所见浮出页面文件及引用对象大小,即是将原计划进行浮出的页面文件或者引用对象进行筛选,从而减少需要读出的页面文件大小,或者其引用对象的大小,那么浮出页面的流量就会减少。其中,降低浮出频率或者分时段多批次进行浮出推广,也会使得每次进行浮出推广时浮出页面流量变少,从而使得Web服务器能够承受浮出页面的流量。可以看出,本申请实施例所述的浮出页面包括一跳页面和二跳页面,其中在计算二跳页面的总流量时,可以根据预估的点击转换率进行计算,并进一步根据一跳页面的第一总流量和二跳页面的第二总流量,计算出所述一跳页面和二跳页面的流量峰值,因为在整个浮出推广的过程中,对服务器主要产生影响的包括流量峰值,所以当计算出的流量峰值较大或者超过Web服务器的当前承受能力时,可以根据所述流量峰值来调整浮出推广的流量,具体调整方式可以包括:缩减相关页面文件及引用对象大小,降低浮出频率,增加Web服务器可用容量,或者分时段多批次进行浮出推广方式等,从而能够提升Web服务器的性能,并且能够降低当客户端点击二跳页面时潜在的高并发流量的风险。其中,所述Web服务器的当前承受能力是从监控系统中取得的,监控系统可以实时获取服务器的当前耗用容量数据,将Web总容量减去当前耗用容量,即为Web服务器的可用容量,该可用容量可以表示出当前承受能力,如果计算出的流量峰值超过了Web服务器的可用容量,则认为超出了Web服务器的当前承受能力。
参考图7,示出了本申请一种浮出页面的流量的调整方法实施例2的流程图,可以包括以下步骤:
步骤701:调整流量系统接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数、二跳页面的点击转换率和一跳页面的网址信息;
在本实施例中,所述浮出客户端的个数可以根据历史数据选取一定阈值天数内每天同一时刻的最高浮出客户端的个数;
步骤702:调整流量系统将获取到的连接服务器数量和浮出频率相乘,再用浮出客户端的个数除以所述乘积,获得的结果为浮出时长;
其中,浮出频率是指连接服务器上设定的每秒向多少个客户端端发送浮出指令的频率值,可以设定为5个/秒,就是每台连接服务器每秒向5个客户端发送浮出指令,也可以设定其他任意合适的值;所述连接服务器数量为用于发送浮出信息的连接服务器总数,可以从监控系统中获取该数值;所述浮出频率可以从连接服务器程序提供的接口中获取;
具体的,例如,浮出客户端的个数为500000,连接服务器数量为50台,浮出频率为5个/秒,那么该次浮出时长的计算方式为:500000/(50*5)=2000秒;
步骤703:调整流量系统判断所述一跳页面中是否包括至少两个指向不同的二跳页面的链接,一跳页面中是否包括有大于一定阈值的引用对象,或者,所述一跳页面的总容量大小是否获取失败,如果是,产生警告信息,如果否,则进入步骤604;
在本步骤中,可以看出,当所述一跳页面中包括至少两个指向不同的二跳页面的链接时,有可能是人为错误,或者,当一跳页面的链接中包括有大于一定阈值的引用对象时,将会产生较大的流量峰值,所述一定阈值可以预先设定,大小可设置成500K等任意数值;或者,当所述一跳页面的总容量大小获取失败时,均产生警告信息,用于提示用户当前出现错误信息;
步骤704:调整流量系统计算所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总容量大小的乘积,所述一跳页面总大小为所述一跳页面的超文本链接协议HTML文件和引用对象的大小之和;
计算所述一跳页面的第一总流量,计算方式同实施例1中的描述一致;
步骤705:调整流量系统判断二跳页面中是否包括有大于一定阈值的引用对象,或者,所述二跳页面的总大小是否获取失败,如果是,则产生警告信息;如果否,则进入步骤606;
当二跳页面中包括有大于一定阈值的引用对象时,将会产生较大的流量峰值,或者,当所述二跳页面的总大小获取失败时,此时,调整流量系统均产生警告信息,用于提示用户当前出现错误信息;
步骤706:调整流量系统计算所述二跳页面的第二总流量,所述第二总流量为所述浮出客户端的个数、所述点击转换率和二跳页面总容量大小的乘积,所述二跳页面总大小为所述二跳页面的HTML文件和引用对象的大小之和;
计算所述二跳页面的第二总流量,计算方式同实施例1中的描述一致;
步骤707:调整流量系统按照不同域名分别进行所述不同域名的一跳页面和二跳页面的流量峰值的获取;所述流量峰值为所述第一总流量和第二总流量之和的两倍,再除以浮出时长所得到的商。
步骤708:调整流量系统判断所述不同域名下的浮出页面流量峰值是否大于相应Web服务器所能承受的最大值,如果是,则根据所述流量峰值调整浮出页面的流量。
在本实施例中,在计算流量峰值的时候,可以按照不同的域名,分别进行各自分属于不同域名的一跳页面和二跳页面的流量获取;具体的,可以通过将一个域名下的所有一跳页面和二跳页面采用树的数据结构放置,例如,可以将该树的根节点设定为一个域名,则该根节点下的子节点可以为该域名下的一跳页面,依次类推,可以在该树的数据结构下存放一跳页面、二跳页面等等,在多个Web服务器情况下,可以为不同的Web服务器设置不同的域名,利用这种结构可以检测到不同Web服务器的具体流量峰值的情况,能够更有利于有针对性的做一些调整,并根据得到的流量峰值的结果相应的对Web服务器的容量进行检查或调整,从而提升Web服务器的性能,避免Web服务器可能因为流量峰值过大而导致的功能瘫痪问题。
参考图8,示出了本申请一种浮出页面的流量的调整方法实施例3的流程图,本实施例可以理解为将本申请的主要思想应用于实际中的一个例子,具体可以包括以下步骤:
步骤801:调整流量系统接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数、二跳页面的点击转换率和一跳页面的网址信息;
在本实施例中,所述浮出客户端的个数为根据历史数据选取的一定阈值天数内每天同一时刻的最高浮出客户端的个数,数值为500000,二跳页面的点击转换率为0.1;所述一跳页面的网址信息为:
http://page.china.alibaba.com/shtml/alitalk/bc/alitalk_star080123.html?iframe_delete=true;其中,调整流量系统还可以通过相连的控制端来接收信息,
步骤802:调整流量系统将获取到的连接服务器数量和浮出频率相乘,再用浮出客户端的个数除以所述乘积,获得的结果为浮出时长;
假设从监控系统获取到的连接服务器数量为65,浮出频率为5次/秒,故浮出时长=500000/(65*5)=1538秒=25.64分钟;
步骤803:调整流量系统判断所述一跳页面中是否包括至少两个指向不同的二跳页面的链接时,或者,所述一跳页面中是否包括有大于一定阈值的引用对象,如果是,进入步骤804,如果否,进入步骤810;
其中,因为一跳页面中含有多个不同的二跳链接,有可能是人为错误,需要进行确认,则产生警告信息提示用户;所述一跳页面的链接中是否包括有大于一定阈值的引用对象时,所述一定阈值例如为500K,则可能会产生流量峰值较大的结果,需要提示用户,则产生警告信息;
步骤804:调整流量系统抓取所述一跳页面的HTML文件及其引用对象的大小,如果失败,进入步骤810;如果成功,则将所述HTML文件和引用对象的大小相加获取一跳页面总容量大小,进入步骤805;
在本实施例中,所述一跳页面总大小为一跳页面本身HTML文件大小,及该一跳页面中的引用对象favicon.ico、icon_point_16.gif、aliclick.js和promotion.css四个文件大小总和;
步骤805:调整流量系统根据所述一跳页面总大小计算所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总容量大小的乘积;
步骤806:调整流量系统判断所述二跳页面的链接中是否包括有大于一定阈值的引用对象时,如果是,进入步骤810,如果否,则进入步骤807;
其中,对所述二跳页面判断链接是否包括有大于一定阈值的引用对象,和前述判断的步骤和原因类似,在此不再进行赘述;
步骤807:调整流量系统抓取所述二跳页面的HTML文件及其引用对象的大小,如果失败,进入步骤810;如果成功,则将所述HTML文件和引用对象的大小相加获取二跳页面总容量大小,进入步骤808;
步骤808:调整流量系统根据所述二跳页面总大小计算所述二跳页面的第二总流量,所述第二总流量为所述浮出客户端的个数、点击转换率和二跳页面总容量大小的乘积;
步骤809:调整流量系统按照不同域名分别进行所述不同域名的一跳页面和二跳页面的流量峰值的获取,所述流量峰值为所述第一总流量和第二总流量之和的两倍,再除以浮出时长所得到的商。
在本实施例中,所述不同域名为“alibaba.com”和“aliimg.com”,所述“alibaba.com”包括三个子域名,所述“aliimg.com”包括四个子域名,可以参考下表所示,为最终计算得到的流量峰值。
Figure G200910135318XD00131
总计:136.44Mbps  浮出时长:25分钟
通过上表中的结果就能够看出,在即时消息客户端进行浮出所涉及每个服务器集群的预估流量峰值,还有浮出时长。如果发现可能给某个服务器集群带来较高的流量峰值,就可以在浮出之前调整该服务器的浮出方案,增加服务器集群容量。
步骤810:调整流量系统产生警告信息。
需要说明的是,在实际中由于可能是人为原因造成一跳页面里有多个指向不同的二跳链接,因此还可以当判断到一跳页面中包含了多个指向不同的二跳页面的链接时,再设置告警提醒;当然,在正常情况下,如果不是人为原因,一跳页面也可能会出现多个指向不同的二跳页面的链接,这时为了区别各个指向不同的二跳页面,就可以在一跳页面源码中的<a href=XXX>语句中增加权重参数,例如:<a href=XXX weight=20>、<a href=YYYweight=30>或者<a href=ZZZ weight=50>,上述语句的含义即为:二跳页面XXX的权重为20、YYY的权重为30、ZZZ的权重为50,调整流量系统在分析一跳页面时,可以获取这些权重参数,将二跳页面XXX、YYY、ZZZ当作不同权重的二跳页面分别计算,则可以得出较为准确的流量值。前述权重值可以根据用户的实际观察统计结果进行设置,例如,红色粗体字链接的权重为50、橙色标准字体为30、蓝色小号字体为20等。
本实施例通过告警提醒的设置,可以更精确的计算得到一次浮出推广过程中的流量峰值,从而也能够基于该流量峰值正确的调整浮出计划,从而达到了提升Web服务器性能的目的。
参考图9,示出了本申请一种浮出页面的流量的调整方法实施例4的流程图,本实施例可以理解为将本申请的主要思想应用于实际中的一个例子,具体可以包括以下步骤:
步骤901:当收到控制端的浮出指令时,统计每台连接服务器上当前在线客户端的数量,并将统计结果作为浮出客户端的个数发送至调整流量系统;
在实际应用中,所有的即时通讯客户端都与连接服务器相连,每台连接服务器都可以维护一个在线用户列表,当收到控制端发来的浮出指令之后,查询与自己相连的即时通讯客户端列表,就可以得到所有连接服务器的在线客户端个数,但是有时并非所有的在线客户端都需要进行浮出,则结合浮出推广条件就可以得出需要浮出的浮出客户端的个数;
步骤902:调整流量系统从控制端获取到二跳页面的点击率和一跳页面的网址信息;
此时,所述控制端用于接收工作人员的指令,并能够将工作人员的相应指令向连接服务器和调整流量系统进行转发;
步骤903:调整流量系统将获取到的服务器数量和浮出频率相乘,再用浮出客户端的个数除以所述乘积,获得的结果为浮出时长;
步骤904:调整流量系统计算所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总容量大小的乘积,所述一跳页面总容量大小为所述一跳页面的超文本链接协议HTML文件和引用对象的大小之和;
步骤905:调整流量系统计算所述二跳页面的第二总流量,所述第二总流量为所述浮出客户端的个数、所述点击转换率和二跳页面总容量大小的乘积,所述二跳页面总大小为所述二跳页面的HTML文件和引用对象的大小之和;
步骤906:调整流量系统按照不同域名分别进行所述不同域名的一跳页面和二跳页面的流量峰值的获取;所述流量峰值为所述第一总流量和第二总流量之和的两倍,再除以浮出时长所得到的商。
步骤907:调整流量系统判断所述浮出页面的流量峰值是否大于Web服务器所能承受的最大值,当所述浮出页面的流量峰值大于Web服务器所能承受的最大值时,根据所述流量峰值调整浮出页面的流量。
本实施例中的步骤903至步骤907的执行过程,前述实施例已经详细介绍,在此不再赘述。
需要说明的是,本申请所述的方法可以是硬件、软件或硬件和软件的组合,在用软件实现本申请所述的方法时,可以优选的采用Python语言编写,使用其它语言亦可,但动态语言如Python、Ruby等编写效率较高;还可以将该软件的功能集成到某个Web工作系统中,根据需求方填制的表单自动进行获取或评估,得出流量峰值的结果。
与上述本申请一种浮出页面的流量的调整方法实施例1所提供的方法相对应,参见图10,本申请还提供了一种浮出页面的流量的调整装置实施例1,在本实施例中,该装置可以包括:
第一接收模块1001,用于接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数、二跳页面的点击转换率和一跳页面的网址信息;
所述浮出客户端的个数表示需要推送浮出页面的浮出客户端的个数,浮出客户端的个数在不同时刻或者不同地点可以有所差异;所述浮出客户端的个数优选的,可以根据历史数据选择一定阈值时间内,例如,一个月,每一天同一个时刻出现的最高值,作为浮出客户端的个数;所述二跳页面的点击转化率也是工作人员的一个估计值,也由工作人员根据以往经验,估计有多少个客户端可能会点击该浮出广告,点击转换率可以是5%或10%等;所述一跳页面的网址信息表示浮出对话框中引用的小页面的统一资源定位符URL;
第一计算模块1002,用于计算所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总容量大小的乘积,所述一跳页面总容量大小为所述一跳页面的超文本链接协议HTML文件和引用对象的大小之和;
其中,所述引用对象是指HTML网页中引用的图片、Flash动画、JavaScript脚本、IFrame或CSS样式表等用户可见或不可见的对象;当浏览器接受到用户访问某个网页(例如http://www.alibaba.com)的用户指令时,会先抓取HTML页面源码,然后根据该页面源码中的相关语句分别抓取引用对象,以向用户端展示整个页面;根据所述一跳页面的网址信息,可以获取到该一跳页面的HTML文件,即是将该一跳页面的网址所指向的HTML页面抓取到本地,并保存为内存空间中的一个临时文件,然后用系统函数获取该临时文件的大小,即可得到所述HTML文件的大小;并同时获取到该一跳页面的引用对象的大小,例如,一跳页面中引用了图片或者音乐等,引用对象的大小即是该图片或音乐的大小,所述一跳页面总容量大小为所述一跳页面本身的HTML文件和其引用对象的大小之和;
第二计算模块1003,用于计算所述二跳页面的第二总流量,所述第二总流量为所述浮出客户端的个数、所述点击转换率和二跳页面总容量大小的乘积,所述二跳页面总容量大小为所述二跳页面的HTML文件和引用对象的大小之和;
根据所述一跳页面的网址信息,首先获取一跳页面的HTML文件,并分析一跳页面的源码,获取源码中语句<a href=XXX>的信息,其中XXX所只带的内容便是二跳页面的链接,即是二跳页面的网址信息,然后再获取该二跳页面的HTML文件,并获取到该二跳页面的引用对象的大小,例如,二跳页面中引用了图片或者音乐等,引用对象的大小即是该图片或音乐的大小,所述二跳页面总大小为所述二跳页面本身的HTML文件和其引用对象的大小之和;
第一获取模块1004,用于计算所述浮出页面的流量峰值,所述流量峰值为所述第一总流量和第二总流量之和的两倍,再除以浮出时长所得的商。
在实际中,根据监控系统中记录的历史数据显示,一般浮出页面的流量趋势均符合正态分布,而在整个浮出推广的过程中,对服务器主要产生影响的包括流量峰值,因此,浮出页面变化过程所产生的总流量相当于给定的三角形的面积,即是一次浮出推广产生的所有相关流量,那么流量峰值则相当于该三角形的高,因此,计算该三角形的高即是计算出了流量峰值;在本实施例中,在计算所述一跳页面和二跳页面的流量峰值时,因此,由所述第一获取模块获取所述流量峰值,即是所述第一总流量和第二总流量之和的两倍,再除以浮出时长所得到的商。
第一调整模块1005,用于根据浮出页面的流量峰值调整浮出页面的流量。
在实际应用中,所述调整模块1005的调整方式具体可以包括:缩减浮出页面文件及引用对象大小,降低浮出频率,或者分时段多批次进行浮出推广。所见浮出页面文件及引用对象大小,即是将原计划进行浮出的页面文件或者引用对象进行筛选,从而减少需要读出的页面文件大小,或者其引用对象的大小,那么浮出页面的流量就会减少。其中,降低浮出频率或者分时段多批次进行浮出推广,也会使得每次进行浮出推广时浮出页面流量变少,从而使得Web服务器能够承受浮出页面的流量。可以看出,本申请实施例所述的浮出页面包括一跳页面和二跳页面,其中在第二计算模块计算二跳页面的总流量时,可以根据预估的点击转换率进行计算,并进一步根据一跳页面的第一总流量和二跳页面的第二总流量,计算出所述一跳页面和二跳页面的流量峰值,当流量峰值较大或者超过Web服务器的当前承受能力时,可以由运营人员根据所述流量峰值来调整浮出推广的流量,或者增加Web服务器可用容量等,从而能够提升Web服务器的性能,并且能够降低当客户端点击二跳页面时潜在的高并发流量的风险。
与上述本申请一种浮出页面的流量的调整方法实施例2所提供的方法相对应,参见图11,本申请还提供了一种浮出页面的流量的调整装置实施例2,在本实施例中,该装置可以包括:
第一接收模块1101,用于接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数和一跳页面的网址信息;
第二获取模块1102,用于将获取到的服务器数量和浮出频率相乘,再用浮出客户端的个数除以所述乘积,获得的结果为浮出时长。
第一计算模块1103,用于计算所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总容量大小的乘积,所述一跳页面总容量大小为所述一跳页面的超文本链接协议HTML文件和引用对象的大小之和;
第二计算模块1104,用于计算所述二跳页面的第二总流量,所述第二总流量为所述浮出客户端的个数、所述点击转换率和二跳页面总容量大小的乘积,所述二跳页面总大小为所述二跳页面的HTML文件和引用对象的大小之和;
第一获取模块1105,具体用于按照不同域名分别进行所述不同域名的一跳页面和二跳页面的流量峰值的获取,所述流量峰值为所述第一总流量和第二总流量之和的两倍,再除以浮出时长所得的商。。
第一提示模块1106,用于当所述一跳页面中包括至少两个指向不同的二跳页面的链接时,当一跳页面或二跳页面的链接中包括有大于一定阈值的引用对象时,或者,当所述一跳页面总容量大小或二跳页面总容量大小获取失败时,产生警告信息。
在本实施例所述的装置中,所述第一提示模块可以在出现错误的时候及时产生警告信息以提示用户,并且在获取流量峰值的时候,可以按照不同的域名,分别进行各自分属于不同域名的一跳页面和二跳页面的流量获取;具体的,可以通过将一个域名下的所有一跳页面和二跳页面采用树的数据结构放置,例如,可以将该树的根节点设定为一个域名,则该根节点下的子节点可以为该域名下的一跳页面,依次类推,可以在该树的数据结构下存放一跳页面、二跳页面等,在多个Web服务器情况下,利用这种结构可以检测到不同Web服务器的具体流量峰值的情况,能够更有利于用户有针对性的做一些调整,并根据得到的流量峰值的结果相应的对Web服务器的容量进行检查或调整,从而提升Web服务器的性能,避免Web服务器可能因为流量峰值过大而导致的功能瘫痪问题。
参考图12,示出了本申请一种浮出页面的会话数的调整方法实施例1的流程图,可以包括以下步骤:
步骤1201:调整会话数系统接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数、二跳页面的点击转换率和一跳页面的网址信息;
所述浮出客户端的个数表示需要推送浮出页面的浮出客户端的个数,浮出客户端的个数在不同时刻或者不同地点可以有所差异;所述浮出客户端的个数优选的,可以选择一定阈值时间内,例如,一个月,每一天同一个时刻出现的最高值,作为浮出客户端的个数;所述二跳页面的点击转化率表示有多少个客户端可能会点击该二跳页面的链接,点击转换率在实际中可以是5%或10%等;所述一跳页面的网址信息表示浮出对话框中引用的小页面的统一资源定位符URL;
步骤1202:调整会话数系统计算所述一跳页面的第一总会话数,所述第一总会话数为所述浮出客户端的个数和一跳页面总请求数的乘积,所述一跳页面总请求数为所述一跳页面的引用对象的个数加一;
其中,所述引用对象是指HTML网页中引用的图片、Flash动画、JavaScript脚本、IFrame或CSS样式表等用户可见或不可见的对象;当浏览器接受到用户访问某个网页(例如http://www.alibaba.com)的用户指令时,会先抓取HTML页面源码,然后根据该页面源码中的相关语句分别抓取引用对象,以向用户端展示整个页面;根据所述一跳页面的网址信息,可以获取该一跳页面的引用对象,此处“引用对象”是指一跳页面引用到的图片、脚本、样式表或动画文件等;而页面对象则是一跳页面本身与所有引用对象的总称,一个页面对象对应一个请求,例如,抓取一个HTML页面是一个请求,浏览器解析该HTML页面之后,发现其中引用了一张图片,又发起一个请求去抓取该图片,其余引用对象皆是如此操作;因此,所述一跳页面总请求数为所述一跳页面的引用对象的个数加一;
步骤1203:调整会话数系统计算所述二跳页面的第二总会话数,所述第二总会话数为所述浮出客户端的个数、所述点击转换率和二跳页面总会话数的乘积,所述二跳页面总会话数为所述二跳页面的引用对象的个数加一;
根据所述一跳页面的网址信息,首先获取一跳页面的HTML文件,并分析一跳页面的源码,获取源码中语句<a href=XXX>的信息,其中XXX所只带的内容便是二跳页面的链接,即是二跳页面的网址信息,然后再获取该二跳页面的二跳页面的总请求数;再将所述二跳页面总请求数、点击转换率与所述浮出客户端的个数三者进行相乘,获得的乘积即是所述二跳页面的第二总会话数;
步骤1204:调整会话数系统获取所述一跳页面和二跳页面的会话数峰值,所述会话数峰值为所述第一总会话数和第二总会话数之和的两倍,再除以浮出时长所得到的商。
所述会话数峰值是指整个浮出过程中的会话数最大值,在实际中,根据监控系统中记录的历史数据显示,一般浮出页面的会话数趋势均符合正态分布,而在整个浮出推广的过程中,对服务器主要产生影响的包括会话数峰值,因此,一次浮出的总流量近似相当于三角形的面积,,即是一次浮出推广产生的所有相关流量,那么会话数峰值则相当于该三角形的高,因此,计算该三角形的高即是计算出了会话数峰值;在本实施例中,在计算所述一跳页面和二跳页面的会话数峰值时,因此,所述会话数峰值为所述第一总会话数和第二总会话数之和的两倍,再除以浮出时长所得到的商。
步骤1205:调整会话数系统判断所述会话数峰值是否大于Web服务器所能承受的最大值,如果是,根据所述会话数峰值调整浮出页面的会话数。
可以看出,本申请实施例所述的浮出页面包括一跳页面和二跳页面,其中在计算二跳页面的总会话数时,可以根据预估的点击转换率进行计算,并进一步根据一跳页面的第一总会话数和二跳页面的第二总会话数,计算出所述一跳页面和二跳页面的会话数峰值,因为在整个浮出推广的过程中,对服务器主要产生影响的包括会话数峰值,所以当会话数峰值较大或者超过服务器的当前承受能力时,可以由运营人员根据所述会话数峰值来调整浮出推广的浮出方案等,具体调整方式可以包括:降低浮出频率,增加Web服务器可用容量,或者分时段多批次进行浮出推广方式从而能够提升Web服务器的性能,并且能够降低当客户端点击二跳页面时潜在的高并发会话数的风险。
参考图13,示出了本申请一种浮出页面的会话数的调整方法实施例2的流程图,可以包括以下步骤:
步骤1301:调整会话数系统接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数、二跳页面的点击转换率和一跳页面的网址信息;
在本实施例中,所述浮出客户端的个数为一定阈值天数内每天同一时刻的最高浮出客户端的个数;例如,可以是一个月内每天同一时刻的最高浮出客户端的个数,或者可以前四周内同一日同一时刻的最高浮出段的个数;
步骤1302:调整会话数系统将获取到的连接服务器数量和浮出频率相乘,再用浮出客户端的个数除以所述乘积,获得的结果为浮出时长;
其中,浮出频率是指连接服务器上设定的每秒向多少个客户端端发送浮出指令的频率值,可以设定为5个/秒,就是每台连接服务器每秒向5个客户端发送浮出指令,也可以设定其他任意合适的值;所述连接服务器数量为用于发送浮出信息的连接服务器总数,可以从监控系统中获取该数值;所述浮出频率可以从连接服务器程序提供的接口中获取;
步骤1303:调整会话数系统计算所述一跳页面的第一总会话数,所述第一总会话数为所述浮出客户端的个数和一跳页面总请求数的乘积,所述一跳页面总请求数为所述一跳页面的引用对象的个数加一;
其中,计算所述一跳页面的第一总会话数,计算方式同实施例1中的描述一致;
步骤1304:调整会话数系统计算所述二跳页面的第二总会话数,所述第二总会话数为所述浮出客户端的个数、所述点击转换率和二跳页面总会话数的乘积,所述二跳页面总会话数为所述二跳页面的引用对象的个数加一;
步骤1305:调整会话数系统按照不同域名分别进行所述不同域名的一跳页面和二跳页面的会话数峰值的获取,所述会话数峰值为所述第一总会话数和第二总会话数之和的两倍,再除以浮出时长所得到的商。
在本实施例中,在计算会话数峰值的时候,可以按照不同的域名,分别进行各自分属于不同域名的一跳页面和二跳页面的总会话数获取;具体的,可以通过将一个域名下的所有一跳页面和二跳页面采用树的数据结构放置,例如,可以将该树的根节点设定为一个域名,则该根节点下的子节点可以为该域名下的一跳页面,依次类推,可以在该树的数据结构下存放一跳页面、二跳页面等。
步骤1306:调整会话数系统判断所述不同域名下的会话数峰值是否大于相应Web服务器所能承受的最大值,如果是,则根据所述会话数峰值调整浮出页面的会话数。
进一步的,在本实施例中,还可以包括步骤:
步骤1307:当所述一跳页面中包括至少两个指向不同的二跳页面的链接时,或者,当所述一跳页面总请求数或二跳页面总请求数获取失败时,调整会话数系统产生警告信息。
当所述一跳页面中包括至少两个指向不同的二跳页面的链接时,有可能是人为错误,或者,当所述一跳页面总请求数或二跳页面总请求数获取失败时,均产生警告信息,用于提示用户当前出现错误信息。
在多个Web服务器情况下,利用本申请实施例中按照不同域名的这种结构可以检测到不同Web服务器的具体会话数峰值的情况,能够更有利于用户有针对性的做一些调整,并根据得到的会话数峰值的结果相应的对Web服务器的性能进行维护,并且在本实施例中,还能够在可能出现错误的时候,产生警告信息,从而能够在出现错误的时候提醒工作人员,以免错误的操作降低Web服务器的性能,避免Web服务器可能因为会话数峰值过大而导致的功能瘫痪问题。
参考图14,示出了本申请一种浮出页面的会话数的调整方法实施例3的流程图,本实施例可以理解为将该方法应用于实际中的一个具体例子,可以包括以下步骤:
步骤1401:调整会话数系统接收用户在服务器端输入的浮出页面信息,所述浮出页面信息包括浮出客户端的个数、二跳页面的点击转换率和一跳页面的网址信息;
在本实施例中,所述浮出客户端的个数为一定阈值天数内每天同一时刻的最高浮出客户端的个数,数值为500000,二跳页面的点击转换率为0.1;所述一跳页面的网址信息为:
http://page.china.alibaba.com/shtml/alitalk/bc/alitalk_star080123.html?iframe_delete=true;
步骤1402:调整会话数系统将获取到的服务器数量和浮出频率相乘,再用浮出客户端的个数除以所述乘积,获得的结果为浮出时长;
假设从监控系统获取到的服务器数量为65,浮出频率为5次/秒,故浮出时长=500000/(65*5)=1538秒=25.64分钟;
步骤1403:调整会话数系统判断所述一跳页面中是否包括至少两个指向不同的二跳页面的链接,如果是,进入步骤1404,如果否,进入步骤1409;
其中,因为一跳页面中含有多个不同的二跳链接,有可能是人为错误,需要进行确认,则产生警告信息提示用户;
步骤1404:调整会话数系统获取所述一跳页面的一跳页面总请求数,所述总请求数为所述一跳页面的引用对象加一,如果失败,则产生警告信息;如果成功,进入步骤1405;
在本实施例中,所述一跳页面总请求数即是所述一跳页面的页面对象的个数,即是为一跳页面本身HTML文件及其引用对象favicon.ico、icon_point_16.gif、aliclick.js和promotion.css四个文件的个数总和,即是其引用对象的个数加一;具体的,可以通过抓取所述一跳页面及其引用对象来获取所述一跳页面总请求数;
步骤1405:调整会话数系统根据所述一跳页面总请求数计算所述一跳页面的第一总会话数,所述第一总会话数为所述浮出客户端的个数和一跳页面总请求数的乘积;
步骤1406:调整会话数系统获取所述二跳页面的二跳页面总请求数,所述二跳页面总请求数为所述二跳页面的引用对象加一,如果失败,则产生警告信息,如果成功,则进入步骤1407;
步骤1407:调整会话数系统根据所述二跳页面总请求数计算所述二跳页面的第二总会话数,所述第二总会话数为所述浮出客户端的个数、点击转换率和二跳页面总请求数的乘积;
步骤1408:调整会话数系统按照不同域名分别进行所述不同域名的一跳页面和二跳页面的会话数峰值的获取,所述会话数峰值为所述第一总会话数和第二总会话数之和的两倍,再除以浮出时长所得到的商。
在本实施例中,所述不同域名为“alibaba.com”和“aliimg.com”,所述“alibaba.com”包括三个子域名,所述“aliimg.com”包括四个子域名,可以参考下表所示,为最终计算得到的会话数峰值。
Figure G200910135318XD00241
Figure G200910135318XD00251
总计:2990Sess/sec  浮出时长:25分钟
通过上表中的结果就能够看出,在即时消息客户端进行浮出所涉及每个Web服务器集群的预估会话数峰值,还有浮出时长。如果发现可能给某个Web服务器集群带来较高的会话数峰值,就可以在浮出之前调整该Web服务器的浮出方案,增加Web服务器集群能容纳会话数的容量。
步骤1409:调整会话数系统产生警告信息。
需要说明的是,本申请所述的方法可以是硬件、软件或硬件和软件的组合,在用软件实现本申请所述的方法时,可以优选的采用Python语言编写,使用其它语言亦可,但动态语言如Python、Ruby等编写效率较高;还可以将该软件的功能集成到某个Web工作系统中,根据需求方填制的表单自动进行获取或评估,得出会话数峰值的结果。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
与上述本申请一种浮出页面的会话数的调整方法实施例1所提供的方法相对应,参见图15,本申请还提供了一种浮出页面的会话数的调整装置实施例1,在本实施例中,该装置可以包括:
第二接收模块1501,用于接收用户在服务器端输入的一跳页面信息,所述一跳页面信息包括浮出客户端的个数、二跳页面的点击转换率和一跳页面的网址信息;
所述浮出客户端的个表示需要推送浮出页面的浮出客户端,浮出客户端的个数在不同时刻或者不同地点可以有所差异;所述浮出客户端的个数优选的,可以选择一定阈值时间内,例如,一个月,每一天同一个时刻出现的最高值,作为浮出客户端的个数;所述二跳页面的点击转化率表示有多少个客户端可能会点击该二跳页面的链接,点击转换率在实际中可以是5%或10%等;所述一跳页面的网址信息表示浮出对话框中引用的小页面的统一资源定位符URL;
第三计算模块1502,用于计算所述一跳页面的第一总会话数,所述第一总会话数为所述浮出客户端的个数和一跳页面总请求数的乘积,所述一跳页面总请求数为所述一跳页面的引用对象的个数加一;
其中,所述引用对象是指HTML网页中引用的图片、Flash动画、JavaScript脚本、IFrame或CSS样式表等用户可见或不可见的对象;当浏览器接受到用户访问某个网页(例如http://www.alibaba.com)的用户指令时,会先抓取HTML页面源码,然后根据该页面源码中的相关语句分别抓取引用对象,以向用户端展示整个页面;根据所述一跳页面的网址信息,可以获取该一跳页面的引用对象,此处“引用对象”是指一跳页面引用到的图片、脚本、样式表或动画文件等;而页面对象则是一跳页面本身与所有引用对象的总称,一个页面对象对应一个请求,例如,抓取一个HTML页面是一个请求,浏览器解析该HTML页面之后,发现其中引用了一张图片,又发起一个请求去抓取该图片,其余引用对象皆是如此操作;因此,所述一跳页面总请求数为所述一跳页面的引用对象的个数加一;
第四计算模块1503,用于计算所述二跳页面的第二总会话数,所述第二总会话数为所述浮出客户端的个数、所述点击转换率和二跳页面总会话数的乘积,所述二跳页面总会话数为所述二跳页面的引用对象的个数加一;
根据所述一跳页面的网址信息,首先获取一跳页面的HTML文件,并分析一跳页面的源码,获取源码中语句<a href=XXX>的信息,其中XXX所只带的内容便是二跳页面的链接,即是二跳页面的网址信息,然后再获取该二跳页面的二跳页面的总请求数;
第三获取模块1504,用于获取所述浮出页面的会话数峰值,所述会话数峰值为所述第一总会话数和第二总会话数之和的两倍,再除以浮出时长得到的商。
所述会话数峰值是指整个浮出过程中的会话数最大值,在实际中,根据监控系统中记录的历史数据显示,一般浮出页面的会话数趋势均符合正态分布,而在整个浮出推广的过程中,对服务器主要产生影响的包括会话数峰值,因此,一次浮出的总流量近似相当于三角形的面积,,一次浮出的总流量近似相当于三角形的面积,那么会话数峰值则相当于该三角形的高,因此,计算该三角形的高即是计算出了会话数峰值;在本实施例中,在计算所述一跳页面和二跳页面的会话数峰值时,因此,所述会话数峰值为所述第一总会话数和第二总会话数之和的两倍,再除以浮出时长所得到的商。
第二调整模块1505,用于根据浮出页面的会话数峰值调整浮出页面的会话数。
在本实施例中,本申请实施例所述的浮出页面包括一跳页面和二跳页面,其中在计算二跳页面的总会话数时,可以根据预估的点击转换率进行计算,并进一步根据一跳页面的第一总会话数和二跳页面的第二总会话数,计算出所述一跳页面和二跳页面的会话数峰值,当会话数峰值较大或者超过Web服务器的当前承受能力时,可以由运营人员根据所述会话数峰值来调整浮出推广的浮出方案等,例如,检查相关Web服务器和网络设备的现有容量是否能满足会话数房门的需求,从而能够提升Web服务器的性能,并且能够降低当客户端点击二跳页面时潜在的高并发会话数的风险。
与上述本申请一种浮出页面的会话数的调整方法实施例2所提供的方法相对应,参见图16,本申请还提供了一种浮出页面的会话数的调整装置的优选实施例2,在本实施例中,该装置具体可以包括:
第二接收模块1601,用于接收用户在服务器端输入的一跳页面信息,所述一跳页面信息包括浮出客户端的个数、二跳页面的点击转换率和一跳页面的网址信息;
所述浮出客户端的个数为一定阈值天数内每天同一时刻的最高浮出客户端的个数;例如,可以是一个月内每天同一时刻的最高浮出客户端的个数,或者可以前四周内同一日同一时刻的最高浮出段的个数;
第四获取模块1602,用于将获取到的连接服务器数量和浮出频率相乘,再用浮出客户端的个数除以所述乘积,获得的结果为浮出时长;
浮出频率是指连接服务器上设定的每秒向多少个客户端端发送浮出指令的频率值,可以设定为5个/秒,就是每台连接服务器每秒向5个客户端发送浮出指令,也可以设定其他任意合适的值;
第三计算模块1603,用于计算所述一跳页面的第一总会话数,所述第一总会话数为所述浮出客户端的个数和一跳页面总请求数的乘积,所述一跳页面总请求数为所述一跳页面的引用对象的个数加一;
第四计算模块1604,用于计算所述二跳页面的第二总会话数,所述第二总会话数为所述浮出客户端的个数、所述点击转换率和二跳页面总会话数的乘积,所述二跳页面总会话数为所述二跳页面的引用对象的个数加一;
第三获取模块1605,用于按照不同域名分别进行所述不同域名的浮出页面的会话数峰值的获取,所述会话数峰值为所述第一总会话数和第二总会话数之和的两倍,再除以浮出时长得到的商;
第二提示模块1606,用于当所述一跳页面中包括至少两个指向不同的二跳页面的链接时,或者,当所述一跳页面总请求数或二跳页面总请求数获取失败时,产生警告信息。
在本实施例中,多个Web服务器情况下,利用本申请实施例中按照不同域名的这种结构可以检测到不同Web服务器的具体会话数峰值的情况,能够更有利于用户有针对性的做一些调整,并根据得到的会话数峰值的结果相应的对Web服务器的性能进行维护,并且在本实施例中,还能够在可能出现错误的时候,产生警告信息,从而提升Web服务器的性能,避免Web服务器可能因为会话数峰值过大而导致的功能瘫痪问题。
为了描述的方便,以上所述装置的各部分以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件或硬件中实现。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的浮出页面的流量、会话数的调整方法和装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (22)

1.一种浮出页面的流量的调整方法,其特征在于,该方法包括:
调整流量系统接收浮出页面信息,所述浮出页面信息至少包括浮出客户端的个数和一跳页面的网址信息;
调整流量系统计算所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总容量大小的乘积,所述一跳页面总容量大小为所述一跳页面的超文本链接协议HTML文件和引用对象的大小之和;
调整流量系统获取所述浮出页面的流量峰值,所述流量峰值为所述第一总流量的两倍,再除以浮出时长所得到的商;
调整流量系统判断所述浮出页面的流量峰值是否大于Web服务器所能承受的最大值,如果是,根据所述流量峰值调整浮出页面的流量,所述根据所述流量峰值调整浮出页面的流量的方法包括:缩减浮出页面文件及引用对象大小、降低浮出频率或者分时段多批次进行浮出推广。
2.根据权利要求1所述的方法,其特征在于,所述浮出页面信息还包括二跳页面的点击转换率,则所述调整流量系统获取所述浮出页面的流量峰值之前,还包括:
调整流量系统计算所述二跳页面的第二总流量,所述第二总流量为所述浮出客户端的个数、所述点击转换率和二跳页面总容量大小的乘积,所述二跳页面总容量大小为所述二跳页面的HTML文件和引用对象的大小之和;
相应的,所述调整流量系统获取所述浮出页面的流量峰值,具体包括:
调整流量系统获取所述一跳页面和二跳页面的流量峰值,所述流量峰值为所述第一总流量和第二总流量之和的两倍,再除以浮出时长所得到的商。
3.根据权利要求1所述的方法,其特征在于,所述浮出时长的计算方式为:
将获取到的服务器数量和浮出频率相乘,再用浮出客户端的个数除以所述乘积,获得的结果为浮出时长。
4.根据权利要求1所述的方法,其特征在于,所述调整流量系统获取所述浮出页面的流量峰值,具体为:调整流量系统按照不同域名分别进行所述不同域名的浮出页面的流量峰值的获取。
5.根据权利要求1所述的方法,其特征在于,所述浮出客户端的个数为一定阈值天数内每天同一时刻的最高浮出客户端的个数。
6.根据权利要求1-5任一项所述的方法,其特征在于,当所述一跳页面中包括至少两个指向不同的二跳页面的链接时,
当一跳页面或二跳页面的链接中包括有大于一定阈值的引用对象时,
或者,当所述一跳页面总容量大小或二跳页面总容量大小获取失败时,调整流量系统产生警告信息。
7.一种浮出页面的流量的调整装置,其特征在于,该装置包括:
第一接收模块,用于接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数和一跳页面的网址信息;
第一计算模块,用于计算所述一跳页面的第一总流量,所述第一总流量为所述浮出客户端的个数和一跳页面总容量大小的乘积,所述一跳页面总容量大小为所述一跳页面的超文本链接协议HTML文件和引用对象的大小之和;
第一获取模块,用于获取所述浮出页面的流量峰值,所述流量峰值为所述第一总流量的两倍,再除以浮出时长所得到的商;
第一调整模块,用于判断所述浮出页面的流量峰值是否大于Web服务器所能承受的最大值,如果是,根据浮出页面的流量峰值调整浮出页面的流量,所述根据所述流量峰值调整浮出页面的流量的方法包括:缩减浮出页面文件及引用对象大小、降低浮出频率或者分时段多批次进行浮出推广。
8.根据权利要求7所述的装置,其特征在于,所述浮出页面信息还包括二跳页面的点击转换率,则所述装置还包括:
第二计算模块,用于计算所述二跳页面的第二总流量,所述第二总流量为所述浮出客户端的个数、所述点击转换率和二跳页面总容量大小的乘积,所述二跳页面总容量大小为所述二跳页面的HTML文件和引用对象的大小之和;
相应的,所述第一获取模块具体用于,获取所述一跳页面和二跳页面的流量峰值,所述流量峰值为所述第一总流量和第二总流量之和的两倍,再除以浮出时长所得到的商。
9.根据权利要求7所述的装置,其特征在于,还包括:
第二获取模块,用于将获取到的服务器数量和浮出频率相乘,再用浮出客户端的个数除以所述乘积,获得的结果为浮出时长。
10.根据权利要求7所述的装置,其特征在于,所述第一获取模块,具体用于按照不同域名分别进行所述不同域名的浮出页面的流量峰值的获取。
11.根据权利要求7-10任一项所述的装置,其特征在于,还包括:第一提示模块,用于当所述一跳页面中包括至少两个指向不同的二跳页面的链接时,
当一跳页面或二跳页面的链接中包括有大于一定阈值的引用对象时,
或者,当所述一跳页面总容量大小或二跳页面总容量大小获取失败时,产生警告信息。
12.一种浮出页面的会话数的调整方法,其特征在于,该方法包括:
调整会话数系统接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数和一跳页面的网址信息;
调整会话数系统计算所述一跳页面的第一总会话数,所述第一总会话数为所述浮出客户端的个数和一跳页面总请求数的乘积,所述一跳页面总请求数为所述一跳页面的引用对象的个数加一;
调整会话数系统获取所述浮出页面的会话数峰值,所述会话数峰值为所述第一总会话数的两倍,再除以浮出时长所得到的商;
调整会话数系统判断所述会话数峰值是否大于Web服务器所能承受的最大值,如果是,根据所述会话数峰值调整浮出页面的会话数,所述根据所述会话数峰值调整浮出页面的会话数包括:降低浮出频率、增加Web服务器可用容量或者分时段多批次进行浮出推广。
13.根据权利要求12所述的方法,其特征在于,所述浮出页面信息还包括:二跳页面的点击转换率;则所述调整会话数系统获取所述浮出页面的会话数峰值之前,还包括:
调整会话数系统计算所述二跳页面的第二总会话数,所述第二总会话数为所述浮出客户端的个数、所述点击转换率和二跳页面总请求数的乘积,所述二跳页面总请求数为所述二跳页面的引用对象的个数加一;
则相应的,所述调整会话数系统获取所述浮出页面的会话数峰值,具体包括:
调整会话数系统获取所述一跳页面和二跳页面的会话数峰值,所述会话数峰值为所述第一总会话数和第二总会话数之和的两倍,再除以浮出时长所得到的商。
14.根据权利要求12所述的方法,其特征在于,所述浮出时长的计算方式为:
将获取到的服务器数量和浮出频率相乘,再用浮出客户端的个数除以所述乘积,获得的结果为浮出时长。
15.根据权利要求12所述的方法,其特征在于,所述调整会话数系统获取所述浮出页面的会话数峰值,具体为:调整会话数系统按照不同域名分别进行所述不同域名的浮出页面的会话数峰值的获取。
16.根据权利要求12所述的方法,其特征在于,所述浮出客户端的个数为一定阈值天数内每天同一时刻的最高浮出客户端的个数。
17.根据权利要求12-16任一项所述的方法,其特征在于,还包括:当所述一跳页面中包括至少两个指向不同的二跳页面的链接时,或者,当所述一跳页面总请求数或二跳页面总请求数获取失败时,调整会话数系统产生警告信息。
18.一种浮出页面的会话数的调整装置,其特征在于,该装置包括:
第二接收模块,用于接收浮出页面信息,所述浮出页面信息包括浮出客户端的个数和一跳页面的网址信息;
第三计算模块,用于计算所述一跳页面的第一总会话数,所述第一总会话数为所述浮出客户端的个数和一跳页面总请求数的乘积,所述一跳页面总请求数为所述一跳页面的引用对象的个数加一;
第三获取模块,用于获取所述浮出页面的会话数峰值,所述会话数峰值为所述第一总会话数的两倍,再除以浮出时长得到的商;
第二调整模块,用于判断所述会话数峰值是否大于Web服务器所能承受的最大值,如果是,根据所述会话数峰值调整浮出页面的会话数,所述根据所述会话数峰值调整浮出页面的会话数包括:降低浮出频率、增加Web服务器可用容量或者分时段多批次进行浮出推广。
19.根据权利要求18所述的装置,其特征在于,所述浮出页面信息还包括:二跳页面的点击转换率,则所述装置还包括:
第四计算模块,用于计算所述二跳页面的第二总会话数,所述第二总会话数为所述浮出客户端的个数、所述点击转换率和二跳页面总请求数的乘积,所述二跳页面总请求数为所述二跳页面的引用对象的个数加一;
则相应的,所述第三获取模块,具体用于获取所述一跳页面和二跳页面的会话数峰值,所述会话数峰值为所述第一总会话数和第二总会话数之和的两倍,再除以浮出时长所得到的商。
20.根据权利要求18所述的装置,其特征在于,第四获取模块,用于将获取到的服务器数量和浮出频率相乘,再用浮出客户端的个数除以所述乘积,获得的结果为浮出时长。
21.根据权利要求18所述的装置,其特征在于,所述浮出页面为不同域名的浮出页面。
22.根据权利要求18-21任一项所述的装置,其特征在于,还包括:第二提示模块,用于当所述一跳页面中包括至少两个指向不同的二跳页面的链接时,或者,当所述一跳页面总请求数或二跳页面总请求数获取失败时,产生警告信息。
CN200910135318XA 2009-04-20 2009-04-20 一种浮出页面的流量、会话数的调整方法和装置 Expired - Fee Related CN101534258B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN200910135318XA CN101534258B (zh) 2009-04-20 2009-04-20 一种浮出页面的流量、会话数的调整方法和装置
HK10102717A HK1136122A1 (en) 2009-04-20 2010-03-16 Method for adjusting flow and the number of conversations of floating page and apparatus thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910135318XA CN101534258B (zh) 2009-04-20 2009-04-20 一种浮出页面的流量、会话数的调整方法和装置

Publications (2)

Publication Number Publication Date
CN101534258A CN101534258A (zh) 2009-09-16
CN101534258B true CN101534258B (zh) 2012-01-04

Family

ID=41104652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910135318XA Expired - Fee Related CN101534258B (zh) 2009-04-20 2009-04-20 一种浮出页面的流量、会话数的调整方法和装置

Country Status (2)

Country Link
CN (1) CN101534258B (zh)
HK (1) HK1136122A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573043A (zh) * 2015-01-19 2015-04-29 郑州悉知信息技术有限公司 一种电子商务网站的数据分析方法及系统
CN108897886B (zh) * 2018-07-09 2019-09-24 掌阅科技股份有限公司 页面展示方法、计算设备及计算机存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1996285A (zh) * 2006-01-06 2007-07-11 胡擘 一种网页浏览器网中的窗口系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1996285A (zh) * 2006-01-06 2007-07-11 胡擘 一种网页浏览器网中的窗口系统

Also Published As

Publication number Publication date
HK1136122A1 (en) 2010-06-18
CN101534258A (zh) 2009-09-16

Similar Documents

Publication Publication Date Title
CN103942225B (zh) 一种混合型应用客户端的资源调用方法、客户端及系统
CN105045887B (zh) 混合模式跨域数据交互的系统及其方法
CN101122921B (zh) 基于ajax与html标记形成树形显示结构的方法
US20110239103A1 (en) Detecting virality paths and supporting referral monetization
García‐Carreras et al. An empirical link between the spectral colour of climate and the spectral colour of field populations in the context of climate change
CN101741872B (zh) 目标资源的信息获取方法及装置
CN103237003B (zh) 对网络中的高访问流量进行响应的方法和装置
CN103036977A (zh) 基于内容分发网络的业务推送方法及推送系统
CN103279538A (zh) 预加载访问网站中网页的服务器、浏览器客户端和方法
CN109614319B (zh) 自动化测试方法、装置、电子设备及计算机可读介质
Abdulla Analysis and modeling of world wide web traffic
CN109829121A (zh) 一种点击行为数据上报的方法和装置
US20130124971A1 (en) Real time web script refresh using asynchronous polling without full web page reload
CN101534258B (zh) 一种浮出页面的流量、会话数的调整方法和装置
CN105260472A (zh) 一种消息推送方法及装置
CN109670100B (zh) 一种页面数据抓取方法及装置
CN106570185A (zh) 一种电力系统图形跨平台展示方法
CN101383838B (zh) 一种Web界面在线评估的方法、系统和装置
CN111008346A (zh) 一种数据采集方法及装置
Brovelli et al. Improving the Monitoring of the Status of the Environment Through Web Geo‐services: The Example of Large Structures Supervision
JP2007115241A (ja) ネットワーク・サイト、例えばウェブ・サイトからアクセスされたネットワーク、例えばウェブ・ドキュメントの選択された部分をeメール・メッセージに変換するためのシステム、方法、およびコンピュータ・プログラム
Tan et al. Internet-based platform for power system simulating and planning
CN113485902B (zh) 测试业务平台的方法、装置、设备和计算机可读介质
Manhas Comparative study of website page size as design issue in various websites
CN110020076A (zh) 网页数据爬取的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1136122

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1136122

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120104

Termination date: 20210420

CF01 Termination of patent right due to non-payment of annual fee