CN102185741B - 多层架构下估算事务的处理器需求的方法 - Google Patents

多层架构下估算事务的处理器需求的方法 Download PDF

Info

Publication number
CN102185741B
CN102185741B CN 201110155658 CN201110155658A CN102185741B CN 102185741 B CN102185741 B CN 102185741B CN 201110155658 CN201110155658 CN 201110155658 CN 201110155658 A CN201110155658 A CN 201110155658A CN 102185741 B CN102185741 B CN 102185741B
Authority
CN
China
Prior art keywords
transaction
server
session
transactions
shortest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201110155658
Other languages
English (en)
Other versions
CN102185741A (zh
Inventor
张振
丁轶群
李善平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN 201110155658 priority Critical patent/CN102185741B/zh
Publication of CN102185741A publication Critical patent/CN102185741A/zh
Application granted granted Critical
Publication of CN102185741B publication Critical patent/CN102185741B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种多层架构下估算事务的处理器需求的方法,该方法通过分析生产环境的访问日志检测事务间的相关性;若发现了强相关的事务,通过分析访问日志抽取强相关事务的最短会话子序列,及比该子序列长度小1的子序列;利用上述两种子序列,生成逻辑上正确的、事务类型变化的人工负载;通过在可控的测试环境下运行人工负载,获得该负载下的性能监测数据;最后运用传统的基于回归的服务时间估算方法得到事务的平均服务时间。本发明避免了现有回归方法在负载比例变化不大时面临的多元共线性问题,能够准确地计算出各种事务类型的平均服务时间;准确的事务服务时间能够协助做出合理的容量规划,从而降低企业的采购成本,保证网络服务的性能。

Description

多层架构下估算事务的处理器需求的方法
技术领域
本发明涉及基于性能测量领域,特别是涉及一种针对多层架构中服务器处理器需求估算的方法。
背景技术
多层架构是业界搭建网络服务的标准,如何估算网络服务对每一层服务器资源,尤其是处理器的需求是企业容量规划的关键。在多层架构下,网络服务通常以多种“请求-回复”模式的事务存在。不同类型的事务对于服务器资源有不同的需求(例如在电子商务网站,结算事务往往比浏览事务耗费更多的处理器资源);同一种事务对于不同层的服务器有不同的需求(例如浏览事务在Web服务器层往往比在数据库层需要更多的处理器资源)。为了了解网络服务的资源需求,须要知道各种类型的事务在各层的资源需求。由于缓存和高速网络等技术的广泛使用,网络服务常常受限于处理器的能力,而不是硬盘和网络的能力,因此尤其需要关注的是事务对处理器的需求。
事务对处理器的需求可以用事务在处理器上运行所需的平均时间(即平均服务时间)表示。现有获得多层架构下处理器需求的方法有两种,直接测量和间接估算。直接测量的方式须要在应用程序、中间件或者操作系统中插入测量代码,这种方式具有侵入性大、可能影响应用性能等缺点。另外由于一个事务可能须要多次访问一个资源(如处理一个结算事务,数据库往往需要执行多个SQL语句;处理一个浏览事务,web服务器除了提供html页面本身还须提供页面中的图片、样式表、Javascript脚本等),而聚合多次访问的服务时间非常困难。间接估算的方法则利用现有的系统性能监测数据,通过统计推导的方式计算出事务的平均服务时间。这种方式对系统的入侵和性能影响较小,能够自动聚合多次访问的服务时间。
目前在实践中使用较多的一种间接估算方法是回归估算法。该方法把各类事务对处理器的平均服务时间作为未知变量,系统中测量到的各类型事务吞吐量和系统的处理器利用率作为已知量,通过平均服务时间、吞吐量和利用率三者之间的关系建立回归方程式组,使用标准的回归求解方法,如最小二乘法等算法解得事务的服务时间。
 但是回归估算法在实际使用存在一个问题。多个类型的事务间可能会存在相关性,即一种事务经常伴随另一个事务的出现而出现,例如结算请求事务通常伴随着结算确认事务。另外当业务负载变化不大,导致事务比例的相对固定,也能造成事务相关性。相关的事务无法通过回归方法区分开来,从而造成其的服务时间无法准确的估算得到。这个问题在通用的回归方法中也被称作多元共线性问题。传统解决该问题的一种方法是把相关的事务合并成单个事务,但是这种方法当业务负载比例变化时会给出错误的服务时间估计值;另一种方法是利用复杂的回归求解方法,如Ridge 回归法,但是此类方法的参数往往很难确定,且只适用于事务相关性较弱的情况下。不准确的服务时间估值会导致错误的容量规划,从而造成资源的浪费或者网络服务的性能下降。
发明内容
本发明的目的在于针对现有技术的不足,提供一种多层架构下估算事务的处理器需求的方法,该方法能够有效地克服现有方法在事务存在相关性时的多元共线性问题,提高估算的准确度,从而能够更准确的对企业网络服务进行容量规划。
本发明的目的是通过以下技术方案来实现的:
一种针对多层架构中服务器处理器需求估算的方法,该方法包括如下步骤:
(1)获取生产环境网络服务的Web服务器访问日志;
(2)分析访问日志,选取网络服务中主要事务类型;
(3)分析主要事务间的相关性;
(4)生成强相关事务的最短会话子序列对;
(5)建立会话中事务参数化规则;
(6)在测试环境中产生由最短会话子序列对组成的人工负载;
(7)分析访问日志和各服务器的处理器利用率数据,得到各服务器的性能样本集;
(8)对性能样本集运用回归分析算法,求解得到各服务器上各事务的平均服务时间。
进一步地,所述网络服务的Web服务器的访问日志包含有访问请求的URL、时间戳、服务状态、会话标识。
进一步地,所述事务类型由事务的主要的HTML请求决定,不包含内嵌的资源请求(图片、样式表,脚本);所述HTML请求由请求的地址,加上和事务类型相关的参数构成,不包括和事务类型无关的参数。
进一步地,事务相关性由访问日志中,各观测时间里各事务类型数量的相关系数矩阵决定:若相关系数矩阵中任意非对角元素值大于特定阀值,则判定为该元素对应的事务存在强相关性。
进一步地,所述会话由访问日志中的会话标识决定。
进一步地,所述事务的最短会话子序列对由事务的最短会话子序列和比最短会话子序列长度小1的子序列构成。
进一步地,所述事务的最短会话子序列满足:(a)子序列中包含该事务;(b)子序列以该事务结尾;(c)在满足前两条件中的所有子序列中长度最短。
进一步地,所述测试环境和生产环境具有以下特征:
(A)在测试环境运行着和生产环境相同的网络服务代码,具有相同的服务器配置,但测试环境中的服务器的个数可以比生产环境少:
(B)各服务器配置为定期记录各服务器的处理器利用率:
(C)各服务器时钟保持同步。
进一步地,所述的性能样本具有以下特征:
(A)一个性能样本对应于一台服务器的一段观测时间:
(B)一个服务器的性能样本包含 1)该服务器在该时间段完成的各类事务的数量2)该服务器该时间段内的处理器利用率:
(C)生产环境和测试环境的性能样本集合并在一起,作为回归分析的输入。
进一步地,所述回归分析的公式为:
Figure 210665DEST_PATH_IMAGE001
其中,
Figure 101261DEST_PATH_IMAGE002
表示事务类型i在第j个性能样本中出现的次数,
Figure 212830DEST_PATH_IMAGE003
表示事务类型i的平均服务时间,T表示观测窗口的时间长度,
Figure 883983DEST_PATH_IMAGE004
表示第j个性能样本里的处理器利用率。
本发明的有益效果是,相比直接测量事务服务时间的方法,本发明分析和生成人工负载所需的数据主要来自前端服务器的访问日志,另外仅需要使用如何使用网络服务的知识,而不需要对网络服务内部实现的深入了解,减少了性能测试人员学习网络服务业务的时间,减少了和网络服务开发人员沟通的时间;计算平均服务时间所需的数据全部来自于服务器访问日志和系统的全局处理器利用率,这些数据在服务器上普遍可得,不需要额外地安装性能监测软件。另外相比使用复杂的回归方法来克服多元共线性问题,本发明可以利用现有的各种统计分析工具,来回归求解平均服务时间,对统计分析人员的数学要求较小。
附图说明
图1是简化的待测生产环境示意图;
图2是测试环境示意图;
图3是估算服务时间的流程图;
图4是最短会话序列对的抽取示意图。
具体实施方式
本发明通过在可控的测试环境下生成事务类型变化的人工负载,获得在该负载下测试环境中的性能监测数据,最后运用传统的基于回归的服务时间估算方法得到事务的平均服务时间。
本发明的实质是在测试环境下,通过分析服务器访问日志,生成逻辑上正确的,事务类型变化的人工负载,从而避免传统的基于回归方法的服务时间估算方法出现的多元共线性问题。
本发明的具体工作过程是:
1、获取生产环境网络服务的Web服务器访问日志
2、分析访问日志,选取网络服务中主要事务类型。选取的事务类型应当在实际系统中占较大的流量,或者对于业务有关键影响。
3、分析主要事务间的相关性,当相关性不大时直接进入步骤8。
4、生成强相关事务的最短会话子序列对。当部分事务存在较大相关性时,对每一个这样的事务,寻找从网络服务主页到该事务页面的最短会话序列和比最短会话序列长度小1的会话序列。这两个子序列称做最短会话子序列对。网络服务的会话指的是单一用户在单一应用程序中一系列相关的事务,后续的事务往往从前一个事务的返回页面中获得参数。
5、建立会话中事务参数化规则。
6、在测试环境中产生由最短会话序列对组成的人工负载。运行负载前须要好配置测试环境:保证测试环境的软硬件配置和生产环境相同;定期地记录服务器的处理器利用率;设置前端服务器,开启访问日志记录功能;设置各层的服务器时间,保证各服务器的时间基本一致。
7、分析访问日志和各服务器处理器利用率数据,得到各服务器的性能样本集。
8、对性能样本集运用回归分析算法,求解得到各服务器上各事务的平均服务时间。
本发明的有益效果如下:本发明在实施时,通过生成负载类型比例变化的人工数据的方法,避免了现有回归方法在负载比例变化不大时面临的多元共线性问题,能够准确地计算出各种事务类型的平均服务时间,即使有些事务类型在实际负载中存在较强的相关性。准确的事务服务时间能够协助做出合理的容量规划,从而降低企业的采购成本,保证网络服务的性能。
下面结合附图和实例对本发明作进一步介绍:
为了方便介绍多层架构下估算处理器需求的任务,首先介绍多层架构下网络服务的环境。图1 是简化的待测生产环境的示意图,如图所示,用户利用浏览器通过互联网向网络服务系统发送访问请求,访问请求进入系统后会经过防火墙,反向代理等设备(图中略去)到达Web服务器。Web服务器在处理用户请求时还会进一步调用后台服务器的服务,后台服务器一般为数据库服务器。
参考图3给出了多层架构下处理器需求估算方法的数据流程图,包含以下步骤:
1、获取生产环境网络服务的web服务器访问日志。
本发明的最初输入是待测生产环境下的web服务器的访问日志。Web服务器作为网络服务的实际入口,可以在访问日志中记录每一个访问请求的URL、时间戳、服务状态、会话ID等信息。访问日志是分析用户行为,监视系统状态,寻找系统错误的重要信息来源,在生产环境下被普遍使用。访问日志通常以天为标签,分别保存在不同的文件中,为了分析网络服务的特征,需要足够流量的访问记录,最优选取1个月的访问日志,至少需要1天的访问日志。
为了估算服务器处理器需求,访问日志必须包含以下信息:请求URL、时间戳、服务状态,另外为了挖掘出日志中的会话序列信息,最优的实施需要会话ID,如果现有日志中不包含会话ID或者生产环境政策规定不能记录会话ID的情况下,可以替换为用户IP信息。对于服务器管理员来说,配置web服务器输出访问日志是比较简单的。以Tomcat服务器为例,可以在服务器配置文件server.xml中加入下列字符串:
<Valve className="org.apache.catalina.valves.AccessLogValve" directory="logs"
prefix="localhost_access_log." suffix=".txt" pattern="common" resolveHosts="false"/>
其中common模式会记录请求的时间戳、URL,返回代码和用户IP地址。而最优的实施可以加入:
<Valve className="org.apache.catalina.valves.AccessLogValve" directory="logs"
prefix="localhost_access_log." suffix=".txt" pattern="%h %l %u %t %r %s %b %S" resolveHosts="false"/>
其中%t表示记录请求的时间戳,%r 表示记录请求的URL,%s表示记录请求的返回代码,%S表示记录客户的会话ID。
2、选取主要事务类型,具体有如下子步骤:
2.1、过滤掉图片、样式表,脚本等请求的访问记录。一个事务会在访问日志中产生多个资源的访问请求,这些请求通常包括一个主要的HTML页面和其中内嵌的资源,如图片、样式表、脚本等。利用主要的HTML页面的URL即可确定一个事务,而其内嵌资源的URL可以忽略。内嵌资源的URL通常具有一定的模式,如图片会以.jpg等结尾,样式表以.css结尾,脚本以.js结尾。最优的实施利用正则表达式匹配并过滤内嵌资源的URL。
2.2、过滤掉失败的请求记录。访问日志中成功返回的请求会以http返回代码200标志出来。最优的实施过滤返回值非200的请求。
2.3、去除请求记录URL中和类型无关的参数。请求记录的URL既包含了请求的路径,也包含了参数列表。一般使用URL的请求路径就可以唯一标识一类事务,因此URL中的参数可以去除。但是一些应用系统也运用部分参数来区别不同的事务,这些参数须要被保留下来。最优的实施须要网络服务开发人员对参数的去除进行确认。
2.4、对剩余的访问记录,根据步骤2.3修改过的URL进行分类汇总,统计每个URL出现的次数,其中每一个URL对应于一类事务。分类汇总可以通过任意统计工具进行,简单的实施可以利用Excel 。
2.5、对事务按访问的数量排序,保留前n类事务,使得前n类事务的总访问记录数占全部访问记录的一定阀值以上。该阀值最优选择在90%~95%间。另外如果个别事务在业务上有特别重要的意义也可以保留下来。通过去除流量较小的事务,可以有效地控制回归分析的工作量,同时保证回归分析的准确度。保留下来的事务类型即网络服务中的主要事务,下文中的事务如无特别说明即指主要事务。
3、分析主要事务间的相关性。
3.1根据处理器利用率的观测时间间隔(后面提及),对照事务的时间戳,对处于同一观测间隔内的事务按事务类型汇总统计出现次数。
3.2如上一步总共得到了N个时间间隔的事务统计值,且总共有M个事务,则可以用向量
Figure 57475DEST_PATH_IMAGE005
表示M个事务,其中
Figure 881206DEST_PATH_IMAGE006
表示事务i在N个时间间隔里的出现次数。计算X的相关系数矩阵F, 其任意一项
Figure 849162DEST_PATH_IMAGE007
,即事务i和事务j的相关系数,相关系数的值在[-1,1]之间,大于0的相关系数表示事务i和事务j的正相关性,相关系数越大,事务间的相关性越大。计算相关系数矩阵,简单的实施可以采用Matlab中的corrcoef函数。
3.3如果矩阵中任意非对角元素
Figure 319195DEST_PATH_IMAGE008
大于某一阀值,则判定事务i和事务j存在强相关性。阀值最优选取在0.7~0.8间。对存在相关性的事务,执行步骤4;否则,直接执行步骤7。
4、生成强相关事务的最短会话子序列对。
4.1、利用访问日志中的会话标识来抽取日志中的会话序列。最优实施利用会话ID,一般的实施利用用户的IP。根据会话标识对日志中的请求记录进行分类,同一类即为一个会话。当利用用户的IP作为会话信息时,可能存在多个用户使用同一个代理服务器来访问网络服务,或者同一用户在不同时间分别使用网络服务的情况,会造成会话抽取的错误。
4.2、对每一对仍存在相关性的事务,任选一事务,从会话序列中抽取一个会话子序列使得1)子序列中包含该事务2)子序列以该事务结尾3)在满足前两条件中的所有子序列中长度最短。抽取子序列长度最短的序列可以保证事务在序列中有较大的比例。
4.3、对上一步抽取的子序列,再抽取一个长度小1的子序列。这两个子序列构成了最短子序列对,利用最短子序列对就可以在回归分析中给出足够的信息用来估算原本存在相关性的事务的服务时间,因此该事务和原来与其相关的事务间的相关性就被破除了。
下面举一实例说明如何生成最短会话序列。假设在一个电子商务网站应用中,发现事务“结算请求”和事务“结算确认”存在强相关性,任意选择事务“结算请求”。如图 4,在各原始会话序列中寻找所有包含有“结算确认”事务的会话,并抽取其中以 “结算请求”事务结尾且之前不包含其他“结算请求”事务的子序列(“主页-新产品-产品详情-加入购物车-结算请求-结算确认”和“主页-搜索-产品详情-产品详情-加入购物车 -结算请求-结算确认”); 按照会话子序列的长度排列,选取长度最短的子序列(“主页-新产品-产品详情-加入购物车-结算请求-结算确认”);最后再生成一个比最短子序列长度小1的子序列(“主页-新产品-产品详情-加入购物车-结算请求”)。最后得到的最短子序列对为“主页-新产品-产品详情-加入购物车-结算请求-结算确认”和“主页-新产品-产品详情-加入购物车-结算请求”。用这两个子序列生成的负载在之后用来破除“结算请求”和“结算确认”间的相关性。
5、建立会话中事务参数化规则。
事务除了URL外,还包括各种参数,这些参数以“参数-值”对的形式包含在事务请求中。一些类型的参数如“商品代号”、“类别代码”、“客户代号”等的值的分布可以预先确定,也可以从访问日志中分析得到;另一类参数,如“购物车代码”的值是网络服务动态生成的,须要从前一个事务的返回页面中抽取得到。参数化事务是性能测试技术人员日常的工作,因此是容易理解的。参数化事务是业务相关的,每一个网络服务都有不同的参数化规则,确定该规则往往需要网络服务开发人员的辅助。在建立参数化规则时,最优的实施利用现有的负载生成工具的辅助,如开源的负载生成工具JMeter提供的机制(Post Processor),它方便开发从返回页面中抽取参数的逻辑。当建立好事务的参数化规则后,可进一步得到可运行的负载生成脚本。
6、运行由最短会话序列对构成的人工负载。
6.1、准备测试系统的环境,保证在测试环境中运行着和生产系统中相同的网络服务代码,具有相同的服务器配置(服务器的个数可以比生产环境少)。企业为了真实地体现生产系统的特征,方便程序的集成测试、性能测试,常常配备有这样的测试环境,因此该测试环境对于性能测试技术人员是容易获得的。人工负载运行在这样的测试环境,如图2 。
6.2、配置服务器记录处理器利用率。
测试环境和生产环境一样,Web服务器、数据库服务器和其他的服务器会记录处理器的利用率,从而方便对系统的状态进行监控。如Unix下的Sysstat工具,Windows下的Perfmon工具默认都会定期地记录处理器的利用率。一般这些工具的记录周期是若干分钟,如某Unix下的Sysstat默认每隔10分钟收集处理器的利用率。收集的周期可以配置,优选为5~10分钟。收集周期过长会导致收集周期间事务比例变化不大,周期过小则测量到的处理器利用率数据受噪声影响较大。利用较小的收集周期可以间接计算出较大周期的处理器利用率数据,例如现有处理器数据的周期是10分钟,为了获得以20分钟为周期的利用率数据,可以通过对前后两个10分钟处理器利用率的求算数平均得到。另外,最优的实施保证各服务器的收集周期一致,从而方便回归分析。
7、分析访问日志和各服务器的处理器利用率数据,得到各服务器的性能样本集。
7.1、保证服务器时间同步。
Web服务器的访问日志和后台服务器的处理器数据都有时间戳,为了方便匹配两者,须要保证Web服务器和后台服务器的系统时钟一致或者保持固定的差值。最优的实施通过配置时钟服务器,让所有服务器的时钟和时钟服务器保持一致。时钟服务是一种标准的服务器功能,在各服务器中都有支持,如Unix下有ntpd,在Windows 下Windows Time Service。配置时钟服务器是服务器管理员的易于实施的任务。
7.2、运行人工负载。
对于每一个最短会话序列对,使用一定数量的虚拟用户在测试环境中反复运行。虚拟用户的数量须要足够大,从而保证各服务器的负载和生产系统正常负载下类似。服务器的负载可以由CPU利用率表示。一个虚拟用户在请求完一个事务后,等待若干时间后再发送下一个事务请求,等待的时间又叫做思考时间,用来模拟用户在得到网络服务返回页面后的阅读和思考过程。思考时间的长短可以固定设置,也可以由访问日志中分析而得。简单的实施可以把思考时间固定在7~15秒左右。每一个最短会话序列总共运行的时间须足够长,从而保证产生足够多的处理器观测窗口样本。具体的运行时间和处理器利用率收集的周期相关,优选的实施保证总共运行时间在收集周期的10倍以上。如何在负载生成工具中设置上述参数,须视工具分别讨论,这对于性能测试领域的技术人员是易于实施的。
7.3、分析访问日志和各服务器处理器的利用率数据,得到各服务器的性能样本集。
回归方法需要足够多的服务器性能样本,每一个性能样本对应于一台服务器的一段观测时间。一个性能样本包含下列信息:1)该服务器该时间段完成的各类事务的数量2)该服务器该时间段内的处理器利用率。如某服务器的性能样本集合示意为:
Figure 30799DEST_PATH_IMAGE009
服务器的性能样本来源于访问日志和处理器利用数据。对于生产环境,步骤3.1实际上已经分析得到了性能样本。对于测试环境,同样的,对照访问日志的记录时间戳,根据处理器利用率的观测周期,对请求记录按事务类型分类统计个数。统计结果再加上每个观测周期的CPU利用率即为服务器的性能样本。
最后把生产环境的性能样本集和测试环境的性能样本集合并起来,就形成回归分析的输入数据。
8、对性能样本集运用回归分析算法,求解得到各服务器上各事务的平均服务时间。
假设一台服务器共有N个性能样本, M个事务,系统观测的周期为T,并采用下列记号:
·
Figure 958304DEST_PATH_IMAGE003
: 第i个事务的平均服务时间,未知变量。
·
Figure 97161DEST_PATH_IMAGE002
: 第j个性能样本中第i个事务的数量。系统测量得到。
· : 第j个性能样本中的处理器利用率。系统测量得到。
根据Utilization 法则,可以得到以下回归方程式组:
通过求解该方程式组,就可以得到平均服务时间的估算值。为了求解该方程式组,可以使用任何线性回归的求解方法,如最小二乘法。由于平均服务时间永远非负,最优的实施采用非负最小二乘法。该算法可以由Matlab中的lsqnonneg命令提供。
以上对本发明所提供的估算处理器服务时间的方法经行了详细介绍,本中应用了具体个例对本发明的原理及实施方式经行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之出,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种针对多层架构中服务器处理器需求估算的方法,其特征在于,该方法包括如下步骤:
(1)获取生产环境网络服务的Web服务器访问日志;
(2)分析访问日志,选取网络服务中主要事务类型;
(3)分析主要事务间的相关性;
(4)生成强相关事务的最短会话子序列对;
(5)建立会话中事务参数化规则;
(6)在测试环境中产生由最短会话子序列对组成的人工负载;
(7)分析访问日志和各服务器的处理器利用率数据,得到各服务器的性能样本集;
(8)对性能样本集运用回归分析算法,求解得到各服务器上各事务的平均服务时间。
2.如权利要求1所述的方法,其特征在于,所述网络服务的Web服务器的访问日志包含有访问请求的URL、时间戳、服务状态、会话标识。
3.如权利要求1所述的方法,其特征在于,所述事务类型由事务的主要的HTML请求决定,不包含内嵌的资源请求,所述资源请求为图片、样式表或脚本;所述HTML请求由请求的地址,加上和事务类型相关的参数构成,不包括和事务类型无关的参数。
4.如权利要求1所述的方法,其特征在于,事务相关性由访问日志中,各观测时间里各事务类型数量的相关系数矩阵决定:若相关系数矩阵中任意非对角元素值大于特定阀值,则判定为该元素对应的事务存在强相关性。
5.如权利要求1所述的方法,其特征在于,所述会话由访问日志中的会话标识决定。
6.如权利要求1所述的方法,其特征在于,所述事务的最短会话子序列对由事务的最短会话子序列和比最短会话子序列长度小1的子序列构成。
7.如权利要求6所述的方法,其特征在于,所述事务的最短会话子序列满足:(a)子序列中包含该事务;(b)子序列以该事务结尾;(c)在满足前两条件中的所有子序列中长度最短。
8.如权利要求1所述的方法,其特征在于,所述测试环境和生产环境具有以下特征:
(A)在测试环境运行着和生产环境相同的网络服务代码,具有相同的服务器配置,但测试环境中的服务器的个数可以比生产环境少:
(B)各服务器配置为定期记录各服务器的处理器利用率:
(C)各服务器时钟保持同步。
9.如权利要求1所述的方法,其特征在于,所述的性能样本具有以下特征:
(A)一个性能样本对应于一台服务器的一段观测时间:
(B)一个服务器的性能样本包含 1)该服务器在该时间段完成的各类事务的数量2)该服务器该时间段内的处理器利用率:
(C)生产环境和测试环境的性能样本集合并在一起,作为回归分析的输入。
10.如权利要求1所述的方法,其特征在于,所述回归分析的公式为:
Figure 2011101556586100001DEST_PATH_IMAGE001
其中,表示事务类型i在第j个性能样本中出现的次数,
Figure 2011101556586100001DEST_PATH_IMAGE003
表示事务类型i的平均服务时间,T表示观测窗口的时间长度,
Figure 335594DEST_PATH_IMAGE004
表示第j个性能样本里的处理器利用率。
CN 201110155658 2011-06-10 2011-06-10 多层架构下估算事务的处理器需求的方法 Expired - Fee Related CN102185741B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110155658 CN102185741B (zh) 2011-06-10 2011-06-10 多层架构下估算事务的处理器需求的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110155658 CN102185741B (zh) 2011-06-10 2011-06-10 多层架构下估算事务的处理器需求的方法

Publications (2)

Publication Number Publication Date
CN102185741A CN102185741A (zh) 2011-09-14
CN102185741B true CN102185741B (zh) 2013-06-26

Family

ID=44571812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110155658 Expired - Fee Related CN102185741B (zh) 2011-06-10 2011-06-10 多层架构下估算事务的处理器需求的方法

Country Status (1)

Country Link
CN (1) CN102185741B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9646180B2 (en) * 2012-10-26 2017-05-09 Absolute Software Corporation Device monitoring using multiple servers optimized for different types of communications
CN108287831B (zh) * 2017-01-09 2022-08-05 阿里巴巴集团控股有限公司 一种url分类方法和系统、数据处理方法和系统
CN107277146B (zh) * 2017-06-26 2021-01-08 苏州浪潮智能科技有限公司 一种分布式存储业务流量模型生成方法及系统
CN108228352B (zh) * 2017-12-29 2021-07-20 北京视觉世界科技有限公司 事件过滤方法及装置
CN108920668B (zh) * 2018-07-05 2023-04-18 平安科技(深圳)有限公司 一种统一资源定位符url去重方法及装置
CN108984703B (zh) * 2018-07-05 2023-04-18 平安科技(深圳)有限公司 一种统一资源定位符url去重方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6201791B1 (en) * 1997-10-29 2001-03-13 International Business Machines Corp. Method and apparatus for measuring flow capacity of and determining the optimal window size of a communications network
CN101090345A (zh) * 2007-07-20 2007-12-19 哈尔滨工程大学 网络存储系统的性能测试方法
CN101635655A (zh) * 2008-07-25 2010-01-27 阿里巴巴集团控股有限公司 页面性能测试的方法、装置及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6201791B1 (en) * 1997-10-29 2001-03-13 International Business Machines Corp. Method and apparatus for measuring flow capacity of and determining the optimal window size of a communications network
CN101090345A (zh) * 2007-07-20 2007-12-19 哈尔滨工程大学 网络存储系统的性能测试方法
CN101635655A (zh) * 2008-07-25 2010-01-27 阿里巴巴集团控股有限公司 页面性能测试的方法、装置及系统

Also Published As

Publication number Publication date
CN102185741A (zh) 2011-09-14

Similar Documents

Publication Publication Date Title
US7818150B2 (en) Method for building enterprise scalability models from load test and trace test data
CN102185741B (zh) 多层架构下估算事务的处理器需求的方法
US8984125B2 (en) Computer program, method, and information processing apparatus for analyzing performance of computer system
US9146787B2 (en) Analytics for application programming interfaces
EP2590081B1 (en) Method, computer program, and information processing apparatus for analyzing performance of computer system
Chow et al. The mystery machine: End-to-end performance analysis of large-scale internet services
CN110532168B (zh) 全链路接口压测方法、装置、计算机设备及存储介质
US8531984B2 (en) Recording medium storing analysis program, analyzing method, and analyzing apparatus
US9075914B2 (en) Analytics driven development
US8751184B2 (en) Transaction based workload modeling for effective performance test strategies
US20080126534A1 (en) Method and system to monitor parameters of a data flow path in a communication system
US20100094592A1 (en) Using Application Performance Signatures For Characterizing Application Updates
US20130158950A1 (en) Application performance analysis that is adaptive to business activity patterns
CN106021079A (zh) 一种基于用户频繁访问序列模型的Web应用性能测试方法
US11030384B2 (en) Identification of sequential browsing operations
US10411969B2 (en) Backend resource costs for online service offerings
CN111159514B (zh) 网络爬虫的任务有效性检测方法、装置和设备及存储介质
US20130174140A1 (en) Accurately estimating install time
CN107181607A (zh) 一种基于端到端的应用系统故障定位方法及装置
US7779127B2 (en) System and method for determining a subset of transactions of a computing system for use in determing resource costs
Alannsary et al. Measurement and prediction of SaaS reliability in the cloud
US9258203B1 (en) Monitoring computer performance metrics utilizing baseline performance metric filtering
US20080222197A1 (en) Regression-based system and method for determining resource costs for composite transactions
Shu-yue et al. The study on the preprocessing in web log mining
Manjula et al. Reliability evaluation of web applications from click-stream data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130626

CF01 Termination of patent right due to non-payment of annual fee