CN110727518B - 一种数据处理方法及相关设备 - Google Patents

一种数据处理方法及相关设备 Download PDF

Info

Publication number
CN110727518B
CN110727518B CN201910977687.7A CN201910977687A CN110727518B CN 110727518 B CN110727518 B CN 110727518B CN 201910977687 A CN201910977687 A CN 201910977687A CN 110727518 B CN110727518 B CN 110727518B
Authority
CN
China
Prior art keywords
qps
target
time window
average
delay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910977687.7A
Other languages
English (en)
Other versions
CN110727518A (zh
Inventor
何磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201910977687.7A priority Critical patent/CN110727518B/zh
Publication of CN110727518A publication Critical patent/CN110727518A/zh
Application granted granted Critical
Publication of CN110727518B publication Critical patent/CN110727518B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5022Workload threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Complex Calculations (AREA)

Abstract

本申请实施例公开了一种数据处理方法及相关设备,用于调整服务最大并发量,保证服务器不会因为过载而发生故障的同时,尽可能多的利用硬件资源。该方法包括:获取当前时间窗口内的采样样本;根据当前时间窗口内的采样样本确定当前时间窗口的第一每秒查询率QPS;根据第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS;根据当前时间窗口内的采样样本确定当前时间窗口内的采样样本的第一平均时延;根据第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延;根据目标时间窗口的极限QPS以及更新后的目标平均时延确定目标最大并发量;基于目标最大并发量调整目标时间窗口的最大并发量。

Description

一种数据处理方法及相关设备
技术领域
本申请涉及通信领域,特别涉及一种数据处理方法及相关设备。
背景技术
单个服务器的极限处理能力都是存在极限的,当接收请求的速度超过服务自身的极限处理能力时,请求会在服务端不断积压,最终服务会因为超载而出现故障。为了避免这种情况的发生,人们设计了各式各样的限流技术,以保护服务不会超载。
当前主流的限流方案依旧是为服务的并发量或者每秒接收的请求数量配置一个最大值。在微服务时代,服务的拓扑、甚至到硬件资源都是不断变化的。这使得服务的极限处理能力也在不断变化。而配置的固定阈值却不会随着环境的变化而更新,从而使得在环境变化时,服务器将可能面临资源浪费/超载的风险。
发明内容
本申请实施例提供了一种数据处理方法及相关设备,用于调整服务最大并发量,保证服务器不会因为过载而发生故障的同时,尽可能多的利用硬件资源。
本申请实施例第一方面提供了一种数据处理方法,包括:
获取当前时间窗口内的采样样本;
根据所述当前时间窗口内的采样样本确定所述当前时间窗口的第一每秒查询率QPS;
根据所述第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS,所述目标时间窗口为所述当前时间窗口的下一时间窗口;
根据所述当前时间窗口内的采样样本确定所述当前时间窗口内的采样样本的第一平均时延;
根据所述第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延;
根据所述目标时间窗口的极限QPS以及更新后的所述目标平均时延确定目标最大并发量;
基于所述目标最大并发量调整所述目标时间窗口的最大并发量。
可选地,所述根据所述第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS包括:
将所述第一QPS与第二QPS进行对比,得到第一对比结果,所述第二QPS为所述当前时间窗口之前的时间窗口对应的QPS中最大的QPS;
根据所述第一对比结果更新所述目标时间窗口的极限QPS。
可选地,所述根据所述第一对比结果更新所述目标时间窗口的极限QPS包括:
当所述第一对比结果为所述第一QPS大于所述第二QPS时,将所述第一QPS确定为所述目标时间窗口的极限QPS;
当所述第一对比结果为所述第一QPS小于所述第二QPS时,根据第一预设时长内的时间窗口的个数以及所述第一预设时长之前的时间窗口的权重确定平滑系数;
根据所述第一QPS、所述第二QPS以及所述平滑系数更新所述目标时间窗口的极限QPS。
可选地,所述根据所述第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延包括:
将所述第一平均时延与所述目标平均时延进行对比,得到第二对比结果,所述目标平均时延为第二预设时长内的时间窗口中最低的平均时延;
根据所述第二对比结果更新所述目标平均时延。
可选地,所述根据所述第二对比结果更新所述目标平均时延包括:
当所述第二对比结果为所述第一平均时延小于所述目标平均时延时,根据所述第一平均时延、所述当前存储的低负载时的目标平均时延以及所述平滑系数更新所述目标平均时延;
判断当前时刻是否达到所述第二预设时长的终点;
若是,则对所述目标平均时延进行重置处理,得到更新后的所述目标平均时延。
可选地,所述根据所述目标时间窗口的极限QPS以及更新后的所述目标平均时延确定目标最大并发量包括:
根据所述当前时间窗口的负载情况更新调整系数;
根据所述第二QPS、更新后的所述目标平均时延以及更新后的所述调整系数确定所述目标最大并发量。
可选地,所述根据所述当前时间窗口的负载情况更新调整系数包括:
根据所述第一QPS和/或所述第一平均时延判断所述当前时间窗口的服务是否处于低负载情况;
若是,则按照预设规则增加所述调整系数,得到更新后的所述调整系数;
若否,则按照所述预设规则减小所述调整系数,得到更新后的所述调整系数。
本申请实施例第二方面提供了一种数据处理装置,包括:
获取单元,用于获取当前时间窗口内的采样样本;
第一确定单元,用于根据所述当前时间窗口内的采样样本确定所述当前时间窗口的第一每秒查询率QPS;
第一更新单元,用于根据所述第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS,所述目标时间窗口为所述当前时间窗口的下一时间窗口;
第二确定单元,用于根据所述当前时间窗口内的采样样本确定所述当前时间窗口内的采样样本的第一平均时延;
第二更新单元,用于根据所述第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延;
第三确定单元,用于根据所述目标时间窗口的极限QPS以及更新后的所述目标平均时延确定目标最大并发量;
调整单元,用于基于所述目标最大并发量调整所述目标时间窗口的最大并发量。
可选地,所述第一更新单元具体用于:
将所述第一QPS与第二QPS进行对比,得到第一对比结果,所述第二QPS为所述当前时间窗口之前的时间窗口对应的QPS中最大的QPS;
根据所述第一对比结果更新所述目标时间窗口的极限QPS。
可选地,所述第一更新单元根据所述第一对比结果更新所述目标时间窗口的极限QPS包括:
当所述第一对比结果为所述第一QPS大于所述第二QPS时,将所述第一QPS确定为所述目标时间窗口的极限QPS;
当所述第一对比结果为所述第一QPS小于所述第二QPS时,根据第一预设时长内的时间窗口的个数以及所述第一预设时长之前的时间窗口的权重确定平滑系数;
根据所述第一QPS、所述第二QPS以及所述平滑系数更新所述目标时间窗口的极限QPS。
可选地,所述第二更新单元具体用于:
将所述第一平均时延与所述目标平均时延进行对比,得到第二对比结果,所述目标平均时延为第二预设时长内的时间窗口中最低的平均时延;
根据所述第二对比结果更新所述目标平均时延。
可选地,所述第二更新单元根据所述第二对比结果更新所述目标平均时延包括:
当所述第二对比结果为所述第一平均时延小于所述目标平均时延时,根据所述第一平均时延、所述当前存储的低负载时的目标平均时延以及所述平滑系数更新所述目标平均时延;
判断当前时刻是否达到所述第二预设时长的终点;
若是,则对所述目标平均时延进行重置处理,得到更新后的所述目标平均时延。
可选地,所述第三确定单元具体用于:
根据所述当前时间窗口的负载情况更新调整系数;
根据所述第二QPS、更新后的所述目标平均时延以及更新后的所述调整系数确定所述目标最大并发量。
可选地,所述第三确定单元根据所述当前时间窗口的负载情况更新调整系数包括:
根据所述第一QPS和/或所述第一平均时延判断所述当前时间窗口的服务是否处于低负载情况;
若是,则按照预设规则增加所述调整系数,得到更新后的所述调整系数;
若否,则按照所述预设规则减小所述调整系数,得到更新后的所述调整系数。
本申请实施例第三方面提供了一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述所述的数据处理方法的步骤。
本申请实施例第四方面提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的数据处理方法的步骤。
综上所述,可以看出,本申请提供的实施例中,通过获取当前时间窗口内样本的第一QPS以及第一平均时延,并通过第一QPS以及预设的QPS更新策略预测目标时间窗口的极限QPS,且通过第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延,之后根据更新后的极限QPS以及更新后的目标平均时延计算最大并发量,并将该最大并发量应用至目标时间窗口,这样就可以实时保证服务器不会因为过载而发生故障的同时,尽可能多的利用硬件资源。
附图说明
图1为本申请所提供的数据处理方法的一个实施例流程示意图;
图2为本申请所提供的数据处理装置的虚拟结构示意图;
图3为本申请所提供的数据处理装置的硬件结构示意图。
具体实施方式
本申请实施例提供了一种数据处理方法及相关设备,用于确定被测主体的风险等级,可以对打算与被测主体交易的相关主体进行预警,使其及时规避潜在的法律风险。
本申请的说明书和权利要求书及上述附图内的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据排队理论(Little’s Law),当一个服务处于稳定状态时(即每秒接收的请求数大致等于每秒所响应的请求数量),从宏观统计的角度来看,服务每秒处理的请求数量(Query Per Second,QPS)、平均延迟avg_latency以及当前正在处理当内的请求数量(concurrency)会满足以下公式:concurrency=avg_latency*QPS。
由于在短时间内服务的极限QPS可以认为是固定的,当服务端的并发数等于服务的极限QPS低负载时的平均延迟的乘积时,既能够充分的利用服务器资源,而且服务端的延迟也不会因为超载而增加。将此时的并发数量称为最佳并发。本申请通过不断的统计当前服务的QPS与平均延迟,计算出最佳并发的近似值,并将它作为服务的最大并发阈值,来保证尽可能的利用服务端资源的同时,不会发生超载。其中,极限qps,记为peak_qps,低负载时平均latency记为noload_latency,最大并发记为max_concurrency。
下面从数据处理装置的角度对本申请的数据处理方法进行说明,该数据处理装置可以是服务器,也可以是服务器内的服务单元,具体不做限定。
请参阅图1,图1为本申请实施例提供的一种数据处理方法的流程示意图,包括:
101、获取当前时间窗口内的采样样本。
本实施例中,数据处理装置可以获取当前时间窗口内的采样样本,例如该时间窗口为1000ms,可以获取1000ms内的采样样本,下面对如何进行采样进行具体说明:设定一个时间窗口比如1000ms,一个最小样本数量如:300,最大样本数量,如600,一个采样间隔,比如0.1ms。也就是说,开始采样之后的1000ms之内,如果收集到的样本数量<300(比如这段时间客户端没有发过来请求或发送过来的服务请求过少,没有达到最小样本数量),那么直接丢弃当前时间窗口;如果收集到了超过600个样本,即使时间还不够1000ms,也提交该时间窗口的采样样本(比如这段时间客户端发送请求的速度很快);如果经过1000ms,采集到的样本数量在300-600之间,提交该时间窗口。
需要说明的,接收客户端发送的服务请求,并对该服务请求进行处理,之后返回客户端处理结果,这样接收到请求、处理请求、并返回客户端响应的过程可以称之为一次采样。且在每次返回响应时,会记录返回响应的时刻,之后计算上次返回响应的时刻与当前返回响应的时刻之间的差值,判断这个差值是否大于设定的采样间隔,若是,则确定该次采样成功,并记录该次采样对服务请求的处理耗时,也即上次返回响应的时刻与当前返回响应的时刻之间的差值;若否,则确定该次采样不成功,则不记录该次采样。
需要说明的是,数据处理装置在接收到每个服务请求的时候,都会根据当前接收到服务请求的时刻判断当前的服务请求是否需要采样,具体的通过判断接收到该服务请求的时候,距离上次采样的时刻是否达到采样时长,若是,则进行采样,若不是,则不采样。
102、根据当前时间窗口内的采样样本确定当前时间窗口的第一每秒查询率QPS。
本实施例中,可以根据获取到的当前时间窗口内的采样样本确定当前时间窗口内的第一QPS,此处具体不限定如何确定当前周期内时间窗口的第一QPS,例如可以实时的统计每个时间窗口的实际QPS(记为qps_w),也即第一QPS,当然也还可以采用其他的方式获取,具体不做限定。
103、根据第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS。
本实施例中,当得到当前时间窗口的第一QPS,也即实际QPS时,可以根据第一QPS以及预设的QPS更新策略更新目标时间窗口内的极限QPS,其中,该目标时间窗口为当前时间窗口的下一时间窗口。具体的,可以将第一QPS与第二QPS进行对比,得到第一对比结果,该第二QPS为当前时间窗口之前的时间窗口对应的QPS中最大的QPS,之后,根据第一对比结果更新目标时间个窗口的极限QPS。也就是说,可以首先判断第一QPS是否大于第二QPS,当该第一QPS大于第二QPS时,将第一QPS确定为目标时间窗口的QPS;当该第一QPS小于第二QPS时,可以根据第一预设时长内的时间窗口的个数以及第一预设时长内的时间窗口的权重确定平滑系数,其中,该平滑系数是关于指数平滑法的一个系数,平滑系数决定了平滑水平以及对预测值与实际结果之间差异的响应速度,此处确定当前时间窗口对应的平滑系数可以根据实际情况进行选择,当然也还可以根据如下规则进行选择:
(1)、如果时间序列波动不大(也即每一个时间窗口之间的时长差距不大),比较平稳,则平滑系数应取小一点,以减少修正幅度。
(2)、如果时间序列具有迅速且明显的变动倾向,则平滑系数应取大一点,以使预测模型灵敏度高些,以便迅速跟上数据的变化。
(3)、在实际应用过程中,可多取几个值进行试算,取使预测误差较小的平滑系数。
最后,根据第一QPS、第二QPS以及平滑系数确定目标时间窗口的极限QPS。具体的,可以通过如下公式计算得到目标时间窗口的极限QPS:
peak_qps1=(1–alpha)*peak_qps2+alpha*qps_w;
其中,peak_qps1为目标时间窗口的极限QPS,peak_qps2为第二QPS,qps_w为第一QPS,alpha为平滑系数,其中平滑系数的取值为0到1之间。
下面以平滑系数为EMA(Exponential Moving Average,指数移动平均值)的平滑系数为例进行说明,当然也还可以是其他的,具体不做限定。
选用EMA的平滑系数的理由有两个:
1、计算方便,需要维护的数据很少;
2、距离当前时间窗口越长的时间窗口的数据在最终的计算结果里所占的权重越低,假设平滑系数为alpha,那么EMA_n=EMA_n-1*alpha+A_n*(1-alpha)。由于alpha是一个小于1但是接近于1(对应的1-p则是接近于0的),所以EMA_n近似于(1-alpha)*(A_1*alphan+A_2*alphan-1…+An)。可以看出来越早的数据(比如A0)所占的比重越低。
因此,平滑系数的计算可以由如下的公式确定:两个由用户根据实际情况配置的常数N以及epsilon。N的大小代表了预设时长内所包含的时间窗口的个数,另外一个常数epsilon,则代表了预设时长之前的时长内时间窗口的数据所占的权重的变化速度,取一个接近与0的值。那么最终的平滑系数的计算由如下公式确定:
alpha=epsilon1/N
下面结合例子进行说明:
例如预设时长20S内的时间窗口的个数为1000,则N的值为1000,epsilon的值为0.02时,最终计算出来的EMA,其98%的比重由最近1000个数据提供,这1000个数据之前的所有数据加起来所占的比重约为2%,即0.02。
需要说明的是,数据处理装置可以通过第一QPS、第二QPS以及平滑系数以上述的公式计算得到一个QPS,并用该QPS更新目标时间窗口的极限QPS,当然也还可以通过通过第一QPS、第二QPS以及平滑系数以其他的方式得到一个QPS,并用该QPS更新目标时间窗口的极限QPS,具体不做限定。
需要说明的是,上述第二QPS的取值可以按照如下方式进行,最初的第二QPS的取值,可以是根据实际情况进行取值,也可以将第一个时间窗口实测的QPS作为该第二QPS,在后续的取样过程中,可以根据当前时间窗口的实际QPS的取值对第二QPS的取值进行修订,具体如下:
在当前时间窗口的QPS大于第二QPS时,则将第二QPS的值变更为当前时间窗口的QPS的值,在当前时间窗口的QPS小于第二QPS时,则维持目标QPS的值保持不变,依次类推,要保证该第二QPS始终是当前时间窗口之前的时间窗口对应的QPS中取值最大的QPS。
104、根据当前时间窗口内的采样样本确定当前时间窗口内的采样样本的第一平均时延。
本实施例中,可以根据当前时间窗口内的采样样本确定当前时间窗口内的采样样本的第一平均时延,此处具体不限定如何获取当前周期内时间窗口内的采样样本的均时延,例如统计每个时间窗口内样本的平均延迟(记为latency_w),在每次采样之后,会记录每次采样的耗时,之后根据总耗时以及采样次数计算时间窗口的平均时延。这里的时延是指采集一个样本所需要的时间。
105、根据第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延。
本实施例中,当得到当前时间窗口内的采样样本的第一平均时延之后,可以通过第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延。具体的,可以将第一平均时延与当前存储的低负载时的目标平均时延进行对比,得到第二对比结果,该当前存储的低负载时的目标平均时延为第二预设时长内的时间窗口中最低的平均时延,之后根据第二对比结果更新目标平均时延。也就是说,当第二对比结果为第一平均时延小于当前存储的低负载时的目标平均时延时,根据第一平均时延、当前存储的低负载时的目标平均时延以及平滑系数对目标平均时延进行更新,得到更新后的目标平均时延;同时还可以判断当前时刻是否达到第二预设时长的终点,当该当前时刻达到第二预设时长的终点时,则对目标平均时延进行重置处理,得到更新后的目标平均时延,当该当前时刻未达到第二预设时长的终点时,则不对目标平均时延进行更新。也即是说,当latency_w小于noload_latency时,对noload_latency进行更新(当latency_W不小于noload_latency时,不对noload_latency进行更新,当得到当前时间窗口内的采样样本的第一平均时延之后,可以目标平均时延进行对比,只有当前时间窗口内的采样样本的第一平均时延小于目标平均时延时,才对目标时间窗口内采样样本的平均时延进行更新,若当前时间窗口内的采样样本的第一平均时延大于预设平均时延,则说明已经过载,则不对目标时间窗口内采样样本的平均时延进行更新),具体可以通过如下公式计算得到更新后的目标平均时延:
noload_latency 1=(1-alpha)*noload_latency2+alpha*latency_w;
其中,noload_latency1为更新后的目标平均时延,noload_latency2为更新之前的目标平均时延,alpha为平滑系数,且0<alpha<1,latency_w为第一平均时延。
需要说明的是,上述根据第一平均时延、目标平均时延以及平滑系数更新目标平均时延以公式计算得到更新后的目标平均时延,当然也还可以根据第一平均时延、更新之前的目标平均时延以及平滑系数通过其他的方式得到更新之后的目标平均时延,具体不做限定。
需要说明的是,上述目标平均时延服务器低负载时采样样本的平均时延,当然也还可以选择服务器处于其他的负载时的平均时延,具体不做限定。另外,此处的负载(load)是指对当前服务器CPU工作量的度量,是指特定时间间隔内运行队列中的平均线程数。loadaverage表示机器一段时间内的平均load,这个值越低越好,负载过高会导致机器无法处理其他请求及操作,甚至导致死机。负载高的主要原因是由于CPU使用、内存使用以及IO消耗,任意一项使用过多,都将导致服务器负载的急剧攀升。另外,上述所述的低负载指的是负载低于一个预先设定的阈值,该预先设定的阈值可以根据实际情况进行设置,例如可以人为特定时间间隔内运行队列中的平均线程数少于5则认为是低负载,此处仅为举例说明。
需要说明的是,为了适应环境的变化,每隔一段时间(例如1分钟至5分钟之间任意时间,当然也可以根据实际情况进行设置,具体不做限定)会对noload_latency进行重置,也就是说在当前时刻达到一段时间的终点时,则重置当前存储的目标平均时延。重置之前会先对当前时间窗口的max concurrency进行缩小并持续一小段时间(例如5分钟,也可以是其他的时长,具体不做限定),以保证采样样本能够进入低负载的状态,并且进入低负载状态之后采样样本的平均延迟作为新的noload_latency的值。目的是为了快速适应网络拓扑和逻辑的变化,比如网络时延突然增加了,那么noload_latency就会跟着增加,并且及时缩小并发也无法让noload_latency不增加,这个时候通过重置noload_latency可以解决这个问题。
106、根据目标时间窗口的极限QPS以及更新后的目标平均时延确定目标最大并发量。
本实施例中,在得到目标时间窗口的极限QPS以及更新后的目标平均时延之后,可以根据目标时间窗口的极限QPS以及更新后的目标平均时延计算得到目标最大并发量。具体的,可以首先根据当前时间窗口的负载情况更新调整系数,之后,根据第二QPS、更新后的目标平均时延以及更新后的调整系数确定目标最大并发量。
需要说明的是,时间窗口的最大并发量理论上可以通过如下公式计算:
max_concurrency=peak_qps*noload_latency。
其中,max_concurrency为当前时间窗口的下一时间窗口内的采样样本的最大并发,peak_qps为第二目标时间窗口的极限QPS,noload_latency为第二平均时延为更新后的目标平均时延。
但是,由于服务器大部分时候都不会处于满载的状态,这会导致计算得到的peak_qps比实际的极限qps要小。所以会对这个最大并发进行修正,可以通过如下公式计算得到目标最大并发量,该目标最大并发量为修正之后的最大并发量:
max_concurrency=peak_qps*noload_latency*(1+epsilon);
其中,max_concurrency为目标最大并发量,peak_qps为目标时间窗口的极限QPS,noload_latency为更新后的目标平均时延,epsilon为调整系数,且0≤epsilon≤0.3。
需要说明的是在一个实施例中,根据当前时间窗口的负载情况更新调整系数包括:
根据第一QPS和/或第一平均时延判断当前时间窗口的服务是否处于低负载情况;
若是,则按照预设规则增加调整系数,得到更新后的调整系数;
若否,则按照预设规则减小调整系数,得到更新后的调整系数。
也就是说,可以首先判断当前时间窗口的服务是否处于低负载情况,之后,根据低负载情况更新调整系数。当前服务是否为低负载的情况的判断方法如下:
如果以下条件中的任意一个成立,则认为当前服务处于低负载的情况,可以继续扩大调整系数epsilon:
1、当前时间窗口的平均时延≤noload_latency*(1+correction_factor);
2、当前时间窗口的qps≤当前时间窗口的极限qps/(1+correction_factor)。
其中,correction_factor的大小取决于服务qps及latency的波动程度。另外,在得到当前时间窗口是否处于低负载情况之后,可以按照预设规则更新调整系数,具体如下:
调整系数epsilon是一个不断的被动态调整的值,它的取值范围为0-0.3,在这个前提下,在判定服务当前处于低负载的状况,则将调整系数epsilon的值增加change_step,否则将它的值降低change_step,change_step是一个固定的,接近0的常量,默认取0.02(当然也还可以是根据实际情况设置的其他数值,具体不做限定)。这么做是为让调整系数epsilon平滑的变化。
107、基于目标最大并发量调整目标时间窗口的最大并发量。
本实施例中,在得到目标最大并发量之后,可以将该目标最大并发量应用至目标时间窗口中。
综上所述,可以看出,本申请提供的实施例中,通过获取当前时间窗口内样本的第一QPS以及第一平均时延,并通过第一QPS以及预设的QPS更新策略预测目标时间窗口的极限QPS,且通过第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延,之后根据更新后的极限QPS以及更新后的目标平均时延计算最大并发量,并将该最大并发量应用至目标时间窗口,这样就可以实时保证服务器不会因为过载而发生故障的同时,尽可能多的利用硬件资源。
上面对本申请实施例提供的数据处理方法进行说明,下面结合图2对本申请实施例提供的数据处理装置进行说明。
请参阅图2,图2为本申请实施例提供的数据处理装置的实施例示意图,该数据处理装置包括:
获取单元201,用于获取当前时间窗口内的采样样本;
第一确定单元202,用于根据所述当前时间窗口内的采样样本确定所述当前时间窗口的第一每秒查询率QPS;
第一更新单元203,用于根据所述第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS,所述目标时间窗口为所述当前时间窗口的下一时间窗口;
第二确定单元204,用于根据所述当前时间窗口内的采样样本确定所述当前时间窗口内的采样样本的第一平均时延;
第二更新单元205,用于根据所述第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延;
第三确定单元206,用于根据所述目标时间窗口的极限QPS以及更新后的所述目标平均时延确定目标最大并发量;
调整单元207,用于基于所述目标最大并发量调整所述目标时间窗口的最大并发量。
可选地,所述第一更新单元203具体用于:
将所述第一QPS与第二QPS进行对比,得到第一对比结果,所述第二QPS为所述当前时间窗口之前的时间窗口对应的QPS中最大的QPS;
根据所述第一对比结果更新所述目标时间窗口的极限QPS。
可选地,所述第一更新单元203根据所述第一对比结果更新所述目标时间窗口的极限QPS包括:
当所述第一对比结果为所述第一QPS大于所述第二QPS时,将所述第一QPS确定为所述目标时间窗口的极限QPS;
当所述第一对比结果为所述第一QPS小于所述第二QPS时,根据第一预设时长内的时间窗口的个数以及所述第一预设时长之前的时间窗口的权重确定平滑系数;
根据所述第一QPS、所述第二QPS以及所述平滑系数更新所述目标时间窗口的极限QPS。
可选地,所述第二更新单元205具体用于:
将所述第一平均时延与所述目标平均时延进行对比,得到第二对比结果,所述目标平均时延为第二预设时长内的时间窗口中最低的平均时延;
根据所述第二对比结果更新所述目标平均时延。
可选地,所述第二更新单元205根据所述第二对比结果更新所述目标平均时延包括:
当所述第二对比结果为所述第一平均时延小于所述目标平均时延时,根据所述第一平均时延、所述当前存储的低负载时的目标平均时延以及所述平滑系数更新所述目标平均时延;
判断当前时刻是否达到所述第二预设时长的终点;
若是,则对所述目标平均时延进行重置处理,得到更新后的所述目标平均时延。
可选地,所述第三确定单元206具体用于:
根据所述当前时间窗口的负载情况更新调整系数;
根据所述第二QPS、更新后的所述目标平均时延以及更新后的所述调整系数确定所述目标最大并发量。
可选地,所述第三确定单元206根据所述当前时间窗口的负载情况更新调整系数包括:
根据所述第一QPS和/或所述第一平均时延判断所述当前时间窗口的服务是否处于低负载情况;
若是,则按照预设规则增加所述调整系数,得到更新后的所述调整系数;
若否,则按照所述预设规则减小所述调整系数,得到更新后的所述调整系数。
本实施例内的数据处理装置的各单元之间的交互方式如前述图1所示实施例内的描述,具体此处不再赘述。
综上所述,可以看出,本申请提供的实施例中,通过获取当前时间窗口内样本的第一QPS以及第一平均时延,并通过第一QPS预测目标时间窗口的QPS以及通过第一平均时延预测目标时间窗口的平均时延,之后根据预测得到的QPS以及平均时延对目标时间窗口的最大并发量进行调整,这样就可以实时保证服务器不会因为过载而发生故障的同时,尽可能多的利用硬件资源。
上面图2从模块化功能实体的角度对本申请实施例中的数据处理装置进行了描述,下面从硬件处理的角度对本申请实施例中的数据处理装置进行详细描述,请参阅图3,本申请实施例中的数据处理装置300一个实施例,包括:
输入装置301、输出装置302、处理器303和存储器304(其中处理器303的数量可以一个或多个,图3中以一个处理器303为例)。在本申请的一些实施例中,输入装置301、输出装置302、处理器303和存储器304可通过总线或其它方式连接,其中,图3中以通过总线连接为例。
其中,通过调用存储器304存储的操作指令,处理器303,用于执行如下步骤:
获取当前时间窗口内的采样样本;
根据所述当前时间窗口内的采样样本确定所述当前时间窗口的第一每秒查询率QPS;
根据所述第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS,所述目标时间窗口为所述当前时间窗口的下一时间窗口;
根据所述当前时间窗口内的采样样本确定所述当前时间窗口内的采样样本的第一平均时延;
根据所述第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延;
根据所述目标时间窗口的极限QPS以及更新后的所述目标平均时延确定目标最大并发量;
基于所述目标最大并发量调整所述目标时间窗口的最大并发量。
通过调用存储器304存储的操作指令,处理器303,还用于执行图1对应的实施例中的任一方式。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述数据处理方法。
本申请实施例还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述数据处理方法。
本申请实施例还提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
获取当前时间窗口内的采样样本;
根据所述当前时间窗口内的采样样本确定所述当前时间窗口的第一每秒查询率QPS;
根据所述第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS,所述目标时间窗口为所述当前时间窗口的下一时间窗口;
根据所述当前时间窗口内的采样样本确定所述当前时间窗口内的采样样本的第一平均时延;
根据所述第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延;
根据所述目标时间窗口的极限QPS以及更新后的所述目标平均时延确定目标最大并发量;
基于所述目标最大并发量调整所述目标时间窗口的最大并发量。
在具体实施过程中,处理器执行程序时可以实现图1对应的实施例中任一实施方式。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取当前时间窗口内的采样样本;
根据所述当前时间窗口内的采样样本确定所述当前时间窗口的第一每秒查询率QPS;
根据所述第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS,所述目标时间窗口为所述当前时间窗口的下一时间窗口;
根据所述当前时间窗口内的采样样本确定所述当前时间窗口内的采样样本的第一平均时延;
根据所述第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延;
根据所述目标时间窗口的极限QPS以及更新后的所述目标平均时延确定目标最大并发量;
基于所述目标最大并发量调整所述目标时间窗口的最大并发量。
在具体实施过程中,执行计算机程序产品时可以实现图1对应的实施例中任一实施方式。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (15)

1.一种数据处理方法,其特征在于,包括:
获取当前时间窗口内的采样样本,其中,接收到请求、处理请求并返回客户端响应的过程即为一次采样;
根据所述当前时间窗口内的采样样本确定所述当前时间窗口的第一每秒查询率QPS;
根据所述第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS,所述目标时间窗口为所述当前时间窗口的下一时间窗口;
根据获取所述采样样本的总耗时以及获取所述采样样本的总次数,确定所述当前时间窗口的平均时间,得到第一平均时延;
根据所述第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延;
根据所述目标时间窗口的极限QPS以及更新后的所述目标平均时延确定目标最大并发量;
基于所述目标最大并发量调整所述目标时间窗口的最大并发量。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS包括:
将所述第一QPS与第二QPS进行对比,得到第一对比结果,所述第二QPS为所述当前时间窗口之前的时间窗口对应的QPS中最大的QPS;
根据所述第一对比结果更新所述目标时间窗口的极限QPS。
3.根据所述权利要求2所述的方法,其特征在于,所述根据所述第一对比结果更新所述目标时间窗口的极限QPS包括:
当所述第一对比结果为所述第一QPS大于所述第二QPS时,将所述第一QPS确定为所述目标时间窗口的极限QPS;
当所述第一对比结果为所述第一QPS小于所述第二QPS时,根据第一预设时长内的时间窗口的个数以及所述第一预设时长内的时间窗口的权重确定平滑系数;
根据所述第一QPS、所述第二QPS以及所述平滑系数更新所述目标时间窗口的极限QPS。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延包括:
将所述第一平均时延与所述目标平均时延进行对比,得到第二对比结果,所述目标平均时延为第二预设时长内的时间窗口中最低的平均时延;
根据所述第二对比结果更新所述目标平均时延。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第二对比结果更新所述目标平均时延包括:
当所述第二对比结果为所述第一平均时延小于所述目标平均时延时,根据所述第一平均时延、所述当前存储的低负载时的目标平均时延以及平滑系数更新所述目标平均时延,所述平滑系数是根据第一预设时长内的时间窗口的个数以及所述第一预设时长内的时间窗口的权重确定的;
判断当前时刻是否达到所述第二预设时长的终点;
若是,则对所述目标平均时延进行重置处理,得到更新后的所述目标平均时延。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述根据所述目标时间窗口的极限QPS以及更新后的所述目标平均时延确定目标最大并发量包括:
根据所述当前时间窗口的负载情况更新调整系数;
根据所述第二QPS、更新后的所述目标平均时延以及更新后的所述调整系数确定所述目标最大并发量。
7.根据权利要求6所述的方法,其特征在于,所述根据所述当前时间窗口的负载情况更新调整系数包括:
根据所述第一QPS和/或所述第一平均时延判断所述当前时间窗口的服务是否处于低负载情况;
若是,则按照预设规则增加所述调整系数,得到更新后的所述调整系数;
若否,则按照所述预设规则减小所述调整系数,得到更新后的所述调整系数。
8.一种数据处理装置,其特征在于,包括:
获取单元,用于获取当前时间窗口内的采样样本,其中,接收到请求、处理请求并返回客户端响应的过程即为一次采样;
第一确定单元,用于根据所述当前时间窗口内的采样样本确定所述当前时间窗口的第一每秒查询率QPS;
第一更新单元,用于根据所述第一QPS以及预设的QPS更新策略更新目标时间窗口的极限QPS,所述目标时间窗口为所述当前时间窗口的下一时间窗口;
第二确定单元,用于根据获取所述采样样本的总耗时以及获取所述采样样本的总次数,确定所述当前时间窗口的平均时间,得到第一平均时延;
第二更新单元,用于根据所述第一平均时延以及预设的平均时延更新策略更新当前存储的低负载时的目标平均时延;
第三确定单元,用于根据所述目标时间窗口的极限QPS以及更新后的所述目标平均时延确定目标最大并发量;
调整单元,用于基于所述目标最大并发量调整所述目标时间窗口的最大并发量。
9.根据权利要求8所述的装置,其特征在于,所述第一更新单元具体用于:
将所述第一QPS与第二QPS进行对比,得到第一对比结果,所述第二QPS为所述当前时间窗口之前的时间窗口对应的QPS中最大的QPS;
根据所述第一对比结果更新所述目标时间窗口的极限QPS。
10.根据权利要求9所述的装置,其特征在于,所述第一更新单元根据所述第一对比结果更新所述目标时间窗口的极限QPS包括:
当所述第一对比结果为所述第一QPS大于所述第二QPS时,将所述第一QPS确定为所述目标时间窗口的极限QPS;
当所述第一对比结果为所述第一QPS小于所述第二QPS时,根据第一预设时长内的时间窗口的个数以及所述第一预设时长内的时间窗口的权重确定平滑系数;
根据所述第一QPS、所述第二QPS以及所述平滑系数更新所述目标时间窗口的极限QPS。
11.根据权利要求8所述的装置,其特征在于,所述第二更新单元具体用于:
将所述第一平均时延与所述目标平均时延进行对比,得到第二对比结果,所述目标平均时延为第二预设时长内的时间窗口中最低的平均时延;
根据所述第二对比结果更新所述目标平均时延。
12.根据权利要求11所述的装置,其特征在于,所述第二更新单元根据所述第二对比结果更新所述目标平均时延包括:
当所述第二对比结果为所述第一平均时延小于所述目标平均时延时,根据所述第一平均时延、所述当前存储的低负载时的目标平均时延以及平滑系数更新所述目标平均时延,所述平滑系数是根据第一预设时长内的时间窗口的个数以及所述第一预设时长内的时间窗口的权重确定的;
判断当前时刻是否达到所述第二预设时长的终点;
若是,则对所述目标平均时延进行重置处理,得到更新后的所述目标平均时延。
13.根据权利要求8至12中任一项所述的装置,其特征在于,所述第三确定单元具体用于:
根据所述当前时间窗口的负载情况更新调整系数;
根据所述第二QPS、更新后的所述目标平均时延以及更新后的所述调整系数确定所述目标最大并发量。
14.根据权利要求13所述的装置,其特征在于,所述第三确定单元根据所述当前时间窗口的负载情况更新调整系数包括:
根据所述第一QPS和/或所述第一平均时延判断所述当前时间窗口的服务是否处于低负载情况;
若是,则按照预设规则增加所述调整系数,得到更新后的所述调整系数;
若否,则按照所述预设规则减小所述调整系数,得到更新后的所述调整系数。
15.一种计算机可读存储介质,其特征在于,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1至7中任一项所述的数据处理方法的步骤。
CN201910977687.7A 2019-10-14 2019-10-14 一种数据处理方法及相关设备 Active CN110727518B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910977687.7A CN110727518B (zh) 2019-10-14 2019-10-14 一种数据处理方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910977687.7A CN110727518B (zh) 2019-10-14 2019-10-14 一种数据处理方法及相关设备

Publications (2)

Publication Number Publication Date
CN110727518A CN110727518A (zh) 2020-01-24
CN110727518B true CN110727518B (zh) 2022-05-27

Family

ID=69221251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910977687.7A Active CN110727518B (zh) 2019-10-14 2019-10-14 一种数据处理方法及相关设备

Country Status (1)

Country Link
CN (1) CN110727518B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111580961B (zh) * 2020-04-28 2023-12-26 北京达佳互联信息技术有限公司 访问请求处理方法、装置、服务器及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9396039B1 (en) * 2013-09-20 2016-07-19 Amazon Technologies, Inc. Scalable load testing using a queue
CN106302226A (zh) * 2016-10-21 2017-01-04 中国电子科技集团公司第二十八研究所 一种QoS感知的服务动态调度方法
CN108633311A (zh) * 2017-01-26 2018-10-09 华为技术有限公司 一种基于调用链的并发控制的方法、装置及控制节点
CN108845910A (zh) * 2018-05-31 2018-11-20 康键信息技术(深圳)有限公司 大规模微服务系统的监控方法、装置及存储介质
CN108880887A (zh) * 2018-06-20 2018-11-23 山东大学 基于微服务的陪护机器人云服务系统及方法
CN110061930A (zh) * 2019-02-01 2019-07-26 阿里巴巴集团控股有限公司 一种数据流量的限制、限流值的确定方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9641431B1 (en) * 2012-04-18 2017-05-02 Google Inc. System and methods for utilization-based balancing of traffic to an information retrieval system
CN106713166B (zh) * 2015-07-31 2020-10-09 华为技术有限公司 确定拥塞窗口大小的方法及装置
US20170272343A1 (en) * 2016-03-21 2017-09-21 Ca, Inc. Systems and methods for monitoring servers for overloading conditions

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9396039B1 (en) * 2013-09-20 2016-07-19 Amazon Technologies, Inc. Scalable load testing using a queue
CN106302226A (zh) * 2016-10-21 2017-01-04 中国电子科技集团公司第二十八研究所 一种QoS感知的服务动态调度方法
CN108633311A (zh) * 2017-01-26 2018-10-09 华为技术有限公司 一种基于调用链的并发控制的方法、装置及控制节点
CN108845910A (zh) * 2018-05-31 2018-11-20 康键信息技术(深圳)有限公司 大规模微服务系统的监控方法、装置及存储介质
CN108880887A (zh) * 2018-06-20 2018-11-23 山东大学 基于微服务的陪护机器人云服务系统及方法
CN110061930A (zh) * 2019-02-01 2019-07-26 阿里巴巴集团控股有限公司 一种数据流量的限制、限流值的确定方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于SDN的微服务负载均衡方案研究;姜伟 等;《计算机技术与发展》;20190925;第30卷(第2期);23-27 *
大规模分布式电商集群的鲁棒性流量预测研究;石婧文;《中国优秀硕士学位论文全文数据库 基础科学辑》;20190615(第6期);A002-184 *

Also Published As

Publication number Publication date
CN110727518A (zh) 2020-01-24

Similar Documents

Publication Publication Date Title
US11601512B2 (en) System and method for throttling service requests having non-uniform workloads
US9419904B2 (en) System and method for throttling service requests using work-based tokens
US8612180B2 (en) Calibration of resource allocation during parallel processing
US11316792B2 (en) Method and system of limiting traffic
US20120221730A1 (en) Resource control system and resource control method
US7817562B1 (en) Methods and systems for back end characterization using I/O sampling
CN110289994B (zh) 一种集群容量调整方法及装置
US20200012602A1 (en) Cache allocation method, and apparatus
US11042410B2 (en) Resource management of resource-controlled system
JPWO2005017736A1 (ja) ディスクアレイ装置におけるボトルネックを検出するシステムおよびプログラム
US10474383B1 (en) Using overload correlations between units of managed storage objects to apply performance controls in a data storage system
US20220398021A1 (en) Workload management using a trained model
CN112068934A (zh) 一种容器云服务实例收缩的控制系统和方法
KR101630125B1 (ko) 클라우드 컴퓨팅 자원관리 시스템에서의 자원 요구량 예측 방법
CN110727518B (zh) 一种数据处理方法及相关设备
US9436406B2 (en) Migration decision window selection based on hotspot characteristics
CN110688360A (zh) 分布式文件系统存储管理方法、装置、设备及存储介质
CN112015326B (zh) 集群数据处理方法、装置、设备及存储介质
US9021499B2 (en) Moving a logical device between processor modules in response to identifying a varying load pattern
KR100547625B1 (ko) 그리드 정보서비스를 위한 지능형 모니터링 시스템 및 방법
WO2013129061A1 (ja) 同時接続数制御システム、同時接続数制御サーバ、同時接続数制御方法および同時接続数制御プログラム
US11520638B1 (en) Combined active and preinitialized resource management for rapid autoscaling
US11481262B1 (en) Rapid autoscaling with preinitialized instance quantity based on historical scale up rate
US20240126442A1 (en) Data storage system with dynamic workload adjustment based on headroom estimation
CN116610266B (zh) 虚拟机磁盘读写性能的调整方法、装置及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant