CN107317702A - 在线服务系统的服务级别控制方法与系统 - Google Patents

在线服务系统的服务级别控制方法与系统 Download PDF

Info

Publication number
CN107317702A
CN107317702A CN201710443789.1A CN201710443789A CN107317702A CN 107317702 A CN107317702 A CN 107317702A CN 201710443789 A CN201710443789 A CN 201710443789A CN 107317702 A CN107317702 A CN 107317702A
Authority
CN
China
Prior art keywords
service
quality
rank
current
characteristic value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710443789.1A
Other languages
English (en)
Inventor
刘东辉
王俊杰
褚建辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Shenma Search Technology Co Ltd
Original Assignee
Guangdong Shenma Search Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Shenma Search Technology Co Ltd filed Critical Guangdong Shenma Search Technology Co Ltd
Priority to CN201710443789.1A priority Critical patent/CN107317702A/zh
Publication of CN107317702A publication Critical patent/CN107317702A/zh
Priority to PCT/CN2018/090613 priority patent/WO2018228323A1/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5019Ensuring fulfilment of SLA
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5032Generating service level reports

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种在线服务系统的服务级别控制方法与系统。其中服务级别控制方法包括:服务降级步骤,在判断在线服务系统的系统状态下降时,将在线服务系统的服务质量调低至与当前系统状态对应的级别;以及服务恢复步骤,在判断系统状态上升时,暂缓将服务质量恢复至与当前系统状态对应的级别。由此,通过采取快降级、缓恢复的级别控制策略,可以防止在线服务系统的系统状态的抖动性、反复性带来的不利影响,并且还可以为在线服务系统提供更多的时间来进一步恢复其系统状态。

Description

在线服务系统的服务级别控制方法与系统
技术领域
本发明涉及在线服务领域,特别是涉及一种针对在线服务系统的服务级别控制方法和相应系统。
背景技术
基于互联网提供服务的在线服务系统的一个典型特征是流量不稳定。在线服务系统的访问流量除了随着时间周期呈现明显的波峰波谷分布之外,还受热点事件或者特殊活动影响。为了保证在线服务系统所提供的服务的稳定性,往往需要在线服务系统预留足够的服务能力。然而预留的资源仅是基于预期的流量高峰设计的,在服务系统的局部模块异常(比如,cache模块失效)、上下游服务异常或者受到恶意攻击等意外情况,系统仍然存在致命的风险。为了应对这些情况,通常的方法是进行服务降级,即通过牺牲一定的服务质量来释放资源,从而保证系统的基础服务能力。
现有的降级方案通常是预先设定一个阈值,当服务系统的健康状态低于阈值时,系统切换到降级模式,只提供最基础的服务,待服务系统的健康状态上升到阈值以上时,系统恢复到正常的服务状态。现有的降级方案实现简单,但是由于服务系统的不稳定性,容易导致系统在阈值附近抖动,使系统长时间处于高服务压力状态。
因此,需要一种新的在线服务系统的服务级别控制方法与系统,以解决上述至少一个问题。
发明内容
本发明的主要目的在于提供一种相对平稳的在线服务系统的服务级别控制方法与系统。
根据本发明的一个方面,提供了一种在线服务系统的服务级别控制方法,其中在线服务系统提供的服务质量根据系统状态被划分为多个级别,该方法包括:服务降级步骤,在判断在线服务系统的系统状态下降时,将在线服务系统的服务质量调低至与当前系统状态对应的级别;以及服务恢复步骤,在判断系统状态上升时,暂缓将服务质量恢复至与当前系统状态对应的级别。
由此,通过采取快降级、缓恢复的级别控制策略,可以防止在线服务系统的系统状态的抖动性、反复性带来的不利影响,并且还可以为在线服务系统提供更多的时间来进一步恢复其系统状态。
优选地,服务恢复步骤可以包括:在判断系统状态上升时,将服务质量恢复至比当前系统状态对应的级别要低的级别。由此,在提升服务质量的同时,还可以为在线服务系统预留一定的服务能力,用于继续恢复其系统状态。
优选地,系统状态由当前服务能力的特征值所表征,服务质量被划分为与多个特征值阈值相对应的多个级别,并且其中,服务降级步骤可以包括:在判断系统状态下降使得当前特征值满足第一特征值阈值时,立刻将在线服务系统的服务质量调低至与第一特征值阈值对应的级别;以及服务恢复步骤可以包括:在判断系统状态上升使得当前特征值满足第二特征值阈值时,暂缓将服务质量恢复至与第二特征值阈值对应的级别。由此,通过由特征值来表征系统状态,可以简单地根据当前特征值与特征值阈值的关系来执行服务降级步骤和服务恢复步骤。
优选地,服务恢复步骤可以包括:在判断系统状态上升使得当前特征值满足第二特征值阈值达预定时长时,才将服务质量恢复至与第二特征值阈值对应的级别。
由此,针对系统状态上下抖动造成的现象,可以将当前特征值满足第二特征值阈值达预定时长设为附加条件。如此可以避免在线服务系统处于高压力状态,并且还可以为在线服务系统提供额外的恢复时间,有助于系统状态的快速恢复。
优选地,服务恢复步骤可以包括:在判断系统状态上升使得当前特征值满足比第二特征值阈值质量级别更高的第三特征值阈值时,才将服务质量恢复至与第二特征值阈值对应的级别。由此,在提升服务质量的同时,还可以为在线服务系统预留一定的服务能力,用于继续恢复其系统状态。
优选地,服务恢复步骤可以包括:在判断系统状态上升使得当前特征值满足对应于最佳服务质量级别的第二特征值阈值时,只有在当前特征值进一步满足比第二特征值表征更佳服务质量的最佳服务回归值时,才将服务质量恢复至最佳服务质量级别。
由此,可以通过判断当前特征值是否满足最佳服务回归值,确定在线服务系统的系统状态是否稳定在适于提供最佳服务质量级别的状态,在判定系统状态已经稳定在适于提供服务质量级别的状态时,才将服务质量恢复至最佳服务质量级别。
当前服务能力的特征值优选地可以是在线服务系统当前所需处理的队列长度。
根据本发明的另一个方面,还提供了一种在线服务质量控制系统,包括用于提供在线服务的分布式服务系统和一个或多个质量控制服务器,其中,一个或多个质量控制服务器用于:获取用于表征分布式服务系统当前服务能力的特征值;在当前特征值表征分布式服务系统的系统状态下降时,立刻将分布式服务系统的服务质量调低至与当前系统状态对应的级别;以及在当前特征值表征系统状态上升时,暂缓将服务质量恢复至与当前系统状态对应的级别。
优选地,一个或多个质量控制服务器进一步用于:在当前特征值表征系统状态上升时,将服务质量恢复至比当前系统状态对应的级别要低的级别。
优选地,服务质量被划分为与多个特征值阈值相对应的多个级别,并且其中,一个或多个质量控制服务器进一步用于:在判断系统状态下降使得当前特征值满足第一特征值阈值时,立刻将在线服务系统的服务质量调低至与第一特征值阈值对应的级别;以及在判断系统状态上升使得当前特征值满足第二特征值阈值时,暂缓将服务质量恢复至与第二特征值阈值对应的级别。
优选地,一个或多个质量控制服务器进一步用于:在判断系统状态上升使得当前特征值满足第二特征值阈值达预定时长时,才将服务质量恢复至与第二特征值阈值对应的级别。
优选地,一个或多个质量控制服务器进一步用于:在判断系统状态上升使得当前特征值满足比第二特征值阈值质量级别更高的第三特征值阈值时,才将服务质量恢复至与第二特征值阈值对应的级别。
优选地,一个或多个质量控制服务器进一步用于:在判断系统状态上升使得当前特征值满足对应于最佳服务质量级别的第二特征值阈值时,只有在当前特征值进一步满足比第二特征值表征更佳服务质量的最佳服务回归值时,才将服务质量恢复至最佳服务质量级别。
优选地,当前服务能力的特征值是分布式服务系统当前所需处理的队列长度。
优选地,当前服务能力的特征值是分布式服务系统的一个或多个服务模块当前所需处理的队列长度,并且一个或多个质量控制服务器根据特征值调整一个或多个服务模块的服务质量级别。
综上,本发明的在线服务系统的服务级别控制方法与系统,主要包括服务降级步骤和服务恢复步骤,服务降级步骤可以是响应于在线服务系统的系统状态下降立刻执行,服务恢复步骤则是响应于在线服务系统的系统状态上升暂缓恢复。由此,通过采取快降级、缓恢复的级别控制策略,可以防止在线服务系统的系统状态的抖动性、反复性带来的不利影响。并且,通过缓恢复还可以为在线服务系统提供更多的时间来进一步恢复其系统状态。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1是示出了根据本发明一实施例的在线服务系统的服务级别控制方法的示意性流程图。
图2是示出了利用本发明的一具体实施例下的降级触发和升级恢复的示意图。
图3是示出了根据本发明一实施例的在线服务质量控制系统300的结构的功能框图。
图4是示出了根据本发明另一实施例的在线服务质量控制系统300的结构的功能框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本发明述及的在线服务系统主要是指提供在线业务的互联网应用系统,尤其是包含众多服务器并划分为若干模块的分布式在线服务系统,例如可以是在线资讯推荐服务系统、在线搜索服务系统等等。
在线服务系统提供的服务质量可以根据系统状态划分为多个(两个或两个以上)级别,其中,在线服务系统的系统状态可以指示在线服务系统的服务能力或健康状态。所划分的各级别下的服务质量与该级别所对应的系统状态下在线服务系统能够提供或适于提供的服务水平相匹配。在本发明中,系统状态的上升表明在线服务系统的服务能力或健康状态的上升,系统状态的下降表明在线服务系统的服务能力或健康状态的下降。
图1是示出了根据本发明一实施例的在线服务系统的服务级别控制方法的示意性流程图。
如图1所示,本发明的在线服务系统的服务级别控制方法主要包括服务降级步骤(步骤S110)和服务恢复步骤(步骤S120)。
在步骤S110,在判断在线服务系统的系统状态下降时,将在线服务系统的服务质量调低至与当前系统状态对应的级别。
如前文所述,系统状态可以指示在线服务系统的服务能力或健康状态,系统状态上升时,可以表明在线服务系统的服务能力增强或健康状态变好,系统状态下降时,可以表明在线服务系统的服务能力下降或健康状态变差。因此可以根据在线服务系统的健康状态或服务能力的变化来判断系统状态的上升或下降。
在具体实现上,可以根据在线服务系统的服务能力或健康状态的变化趋势、变化程度等多种方式来判断系统状态的上升或下降。在一个实施例中,可以简单地选取能够表征系统状态的一个特征值(例如待处理队列长度),通过将当前特征值与预先设定或是实时调整的阈值进行比较来直接判断系统状态。取决于选取的具体特征值,可以是特征值增大指示系统状态上升(例如,特征值取CPU空闲率的情况),也可以是特征值的减小指示系统状态上升(例如,前述待处理队列长度的情况)。本发明在此不对特征值与系统状态的比例关系加以限定,只要其变动能够反映系统状态的变化即可。
在另一个实施例中,可以选取多个特征值的组合变化来从更多的维度对系统状态进行判断。例如,可以分别为CPU空闲率和待处理队列长度设定相应的(一个或多个)阈值,并且根据两者当前数值与其各自阈值的关系,从整体上判断系统状态的上升或是下降。在其他实施例中,还有引入更多或是其他的维度,本发明对此不做限制。
在判定在线服务系统的系统状态下降时,表明在线服务系统当前的服务能力下降,此时可以立刻将在线服务系统的服务质量调低至与当前系统状态对应的级别。此处述及的“立刻”是指没有附加条件的随即降级。
在步骤S120,在判断系统状态上升时,暂缓将服务质量恢复至与当前系统状态对应的级别。
如前文所述,由于在线服务系统的流量不稳定特征,在线服务系统的系统状态也会经常出现上下抖动的现象,因此如果在判断在线服务系统的系统状态上升时,立刻将在线服务系统的服务质量恢复至与当前系统状态对应的级别,则有可能会造成在线服务系统持续处于高服务压力状态,不利于在线服务系统的系统状态的恢复。
基于上述考虑,在判断系统状态上升时,可以执行暂缓恢复操作,暂缓将服务质量恢复至与当前系统状态对应的级别,如此可以有效地避免由于系统状态的抖动性、反复性带来的不利影响。
此处述及的暂缓恢复操作可以带有一定的附加条件,也就是说,可以在系统状态上升且满足特定的附加条件后,才将服务质量恢复至与当前系统状态对应的级别。例如,此处述及的附加条件可以是超过预定时间阈值,也就是说,可以在系统状态上升且超过预定时间阈值后才将服务质量恢复至与当前系统状态对应的级别。另外,暂缓恢复操作还可以带有如下将详述的其它附加条件,这里暂不赘述。
需要说明的是,在暂缓恢复操作执行完毕后,可以将服务质量恢复至暂缓恢复操作执行前在线服务系统的当前系统状态所对应的级别,也可以将服务质量恢复至暂缓恢复操作执行完毕后在线服务系统的当前系统状态所对应的级别。
另外,为了减轻在线服务系统的服务压力,使得在线服务系统的系统状态可以得到良好的恢复,在判断系统状态上升并执行了暂缓恢复操作后,可以将服务质量恢复至比当前系统状态对应的级别低一级或数级的其它级别。如此,在提升在线服务系统的服务质量的同时,还可以有助于在线服务系统的系统状态的后续恢复。此处的当前系统状态可以是指暂缓恢复操作执行前在线服务系统的当前系统状态,也可以是指暂缓恢复操作执行完毕后在线服务系统的当前系统状态。
基于上文结合图1的描述可知,本发明的服务级别的控制方法主要包括服务降级步骤和服务恢复步骤,服务降级步骤可以是响应于在线服务系统的系统状态下降立刻执行,服务恢复步骤则是响应于在线服务系统的系统状态上升暂缓恢复。由此,通过采取快降级、缓恢复的级别控制策略,可以防止在线服务系统的系统状态的抖动性、反复性带来的不利影响。并且,通过缓恢复还可以为在线服务系统提供更多的时间来进一步恢复其系统状态。
需要说明的是,虽然上文是先描述的服务降级步骤S110然后描述的服务恢复步骤S120,但是应该理解的是,上述步骤的编号和描述顺序并非对降级和恢复步骤的发生顺序加以限制。在实际运行中,在线服务系统的系统状态可以是先升后降、先降后升、连升几级、连降几级、升降交替等多种变化形式,相应地,在利用本发明的服务级别的控制方法实现对在线服务系统的服务级别的控制时,也可以按照系统状态的实际变化进行对应的降级或是恢复操作。
至此,结合图1简要说明了本发明的服务级别的控制方法的原理及过程。下面结合具体实施例就本发明的服务级别的控制方法做进一步详细说明。
实施例一、
在本实施例中,在线服务系统的系统状态可以由当前服务能力的特征值所表征,相应地,服务质量可以被划分为与多个特征值阈值相对应的多个级别。
如上文所述,在线服务系统可以是多种类型的互联网应用系统,根据在线服务系统的不同,用于表征在线服务系统的服务能力的特征值也不尽相同。例如,对于资讯推荐服务在线系统,可以将当前需要处理的队列长度作为用于表征系统状态的特征值,对于其它分布式任务系统,也可以将系统的当前可用资源、空闲服务器等作为表征系统状态的特征值。
在系统状态由特征值表征时,可以根据当前特征值与特征值阈值的关系来执行服务降级步骤和服务恢复步骤。
具体来说,对于服务降级步骤,可以在判断系统状态下降使得当前特征值满足第一特征值阈值时,立刻将在线服务系统的服务质量调低至与第一特征值阈值对应的级别。
对于服务恢复步骤,可以在判断系统状态上升使得当前特征值满足第二特征值阈值时,暂缓将服务质量恢复至与第二特征值阈值对应的级别。
在本实施例中,特征值与系统状态之间可以是正比例,也可以是反比例,即可以是特征值越大,系统状态越好,也可以是特征值越小,系统状态越好。并且,第一特征值阈值和第二特征值阈值可以相同,也可以不同。
如上文所述,服务恢复步骤中的暂缓恢复操作可以带有一定的附加条件。在本实施例中,可以设定如下几种附加条件。
1.1、在判断系统状态上升使得当前特征值满足第二特征值阈值达预定时长时,才将服务质量恢复至与第二特征值阈值对应的级别。
由此,针对系统状态上下抖动造成的现象,可以将当前特征值满足第二特征值阈值达预定时长设为附加条件。如此可以避免在线服务系统处于高压力状态,并且还有助于在线服务系统的系统状态的快速恢复。
1.2、在判断系统状态上升使得当前特征值满足比第二特征值阈值质量级别更高的第三特征值阈值时,才将服务质量恢复至与第二特征值阈值对应的级别。
第三特征值阈值可以是高于第二特征值阈值一级的特征值阈值,也可以是高于第二特征值阈值数级的特征值阈值。如此,可以使得在线服务系统拥有空闲服务能力改善业务状态。例如,在特征值是在线服务系统当前所需处理的队列长度时,可以使得在线服务系统拥有空闲资源处理队列长度中的任务,以减小队列长度。
1.3、在判断系统状态上升使得当前特征值满足对应于最佳服务质量级别的第二特征值阈值时,只有在当前特征值进一步满足比第二特征值表征更佳服务质量的最佳服务回归值时,才将服务质量恢复至最佳服务质量级别。
第二特征阈值对应于最佳服务质量级别,最佳服务回归值不用于划分质量级别,其仅是用于指示在线服务系统恢复至最佳质量的阈值。在判断系统状态上升到当前特征值满足第二特征阈值并进一步满足最佳服务回归值时,可以表明在线服务系统的系统状态已经稳定在适于提供最佳服务质量级别的状态,此时可以将服务质量恢复至最佳服务质量级别。
实施例二、
图2是示出了利用本发明的一具体实施例下的降级触发和升级恢复的示意图。其中,横坐标为时间轴,纵坐标为特征值,如图2所示,可以设定三个特征值阈值a、b、c。在本实施例中,特征值可以表征在线服务系统当前需要处理的请求队列长度。
1)t2时刻之前,请求队列长度小于特征值阈值b,在线服务系统处于正常服务状态,可以对外提供最佳质量的服务。
2)随着流量的增加,系统无法支撑高质量的服务,请求队列长度不断增加,t2时刻队列长度达到特征值阈值b,此时在线服务系统可以进入一级降级状态,向外提供相对较差质量的服务。
3)随着流量继续增加,在线服务系统仍然无法支撑相对较差质量的服务,请求队列长度继续增加,t3时刻队列长度达到特征值阈值c,此时在线服务系统可以进入二级降级状态,对外只提供最基础的服务。
4)t3到t5阶段,由于在线系统只提供最基础的服务,大量资源得到释放,服务能力得到加强,请求队列长度得到改善,但是在队列长度下降到特征值阈值b之前,在线服务系统可以仍然只提供最基础的服务。此处之所以没有在队列长度降到特征值阈值c之后马上切换回一级降级状态,是为了避免反复,防止在线服务系统一直停留在高压力的状态,使在线服务系统的健康状态能够尽可能快的得到恢复。
5)t5时刻,随着请求队列长度进一步下降到b以下,在线服务系统恢复到一级降级状态。
6)t6时刻,在线系统的服务能力得到完全的恢复,退出一级降级状态,恢复高质量的服务。
综上,本实施例的服务级别控制方法以请求队列长度作为判断系统服务能力的指标,设计了多级阈值,并对降级状态触发和恢复采用不同的阈值,实现了降级的快速触发和慢恢复,避免了单阈值降级触发方案中,系统停留在高服务压力附近抖动的情况,减少了系统风险。在本实施例中,阈值b和c是用于划分服务级别的特征值阈值,阈值a虽然并不用于实际的系统服务级别划分(这是因为在队列长度下降到b时其实已经可以认为系统服务能力已恢复),但可将其看做是最佳服务回归值。换句话说,只有在系统状态恢复到a之后,才能认为系统服务能力已经“稳妥地”完全恢复。
图3是示出了根据本发明一实施例的在线服务质量控制系统300的结构的功能框图。其中,在线服务质量控制系统300的功能模块可以由实现本发明原理的硬件、软件或硬件和软件的结合来实现。本领域技术人员可以理解的是,图3所描述的功能模块可以组合起来或者划分成子模块,从而实现上述发明的原理。因此,本文的描述可以支持对本文描述的功能模块的任何可能的组合、或者划分、或者更进一步的限定。
图3所示的在线服务质量控制系统300可以用于实现图1、图2述及的服务级别控制方法,下面仅就在线服务质量控制系统300可以具有的功能模块以及各功能模块可以执行的操作做简要说明,对于其中涉及的细节部分可以参见上文结合图1、图2的描述,这里不再赘述。
如图3所示,在线服务质量控制系统300包括用于提供在线服务的分布式服务系统310和质量控制服务器320。此处述及的分布式服务系统310可以等同于上文述及的在线服务系统。
质量控制服务器320可以获取用于表征分布式服务系统310当前服务能力的特征值,并在当前特征值表征分布式服务系统310的系统状态下降时,立刻将分布式服务系统310的服务质量调低至于当前系统状态对应的级别,并且,在在当前特征值表征系统状态上升时,暂缓将服务质量恢复至与当前系统状态对应的级别。换句话说,并入了质量控制服务器320的在线服务质量控制系统300也可以看做是带有质量控制功能的分布式在线服务系统。
作为本发明的一个可选实施例,在当前特征值表征所述系统状态上升时,一个或多个质量控制服务器320还可以将服务质量恢复至比当前系统状态对应的级别要低的级别。
作为本发明的另一个可选实施例,服务质量可以被划分为与多个特征值阈值相对应的多个级别,并且其中,一个或多个质量控制服务器320可以进一步用于:在判断系统状态下降使得当前特征值满足第一特征值阈值时,立刻将在线服务系统的服务质量调低至与第一特征值阈值对应的级别;以及在判断系统状态上升使得当前特征值满足第二特征值阈值时,暂缓将服务质量恢复至与第二特征值阈值对应的级别。
作为本发明的另一个可选实施例,一个或多个质量控制服务器320可以进一步用于:在判断系统状态上升使得当前特征值满足第二特征值阈值达预定时长时,才将服务质量恢复至与第二特征值阈值对应的级别。
作为本发明的另一个可选实施例,一个或多个质量控制服务器320可以进一步用于:在判断系统状态上升使得当前特征值满足比第二特征值阈值质量级别更高的第三特征值阈值时,才将服务质量恢复至与特征值阈值对应的级别。
作为本发明的另一个可选实施例,一个或多个质量控制服务器320可以进一步用于:在判断系统状态上升使得当前特征值满足对应于最优服务质量级别的第二特征值阈值时,只有在当前特征值进一步满足比第二特征值表征更佳服务质量的最佳服务回归值时,才将服务质量恢复至最佳服务质量级别。
作为本发明的另一个可选实施例,当前服务能力的特征值可以是分布式服务系统310当前所需处理的队列长度。
图4是示出了根据本发明另一实施例的在线服务质量控制系统的结构的示意性方框图。
如图4所示,分布式服务系统310可以细化为包括多个服务模块,质量控制服务器320可以与分布式服务系统310中的服务模块连接,其中,图4是示出了在线服务质量控制系统300包括一个质量控制服务器320的情形,应该知道,在线服务质量控制系统300还可以包括多个质量控制服务器320,多个质量控制服务器320可以与分布式服务系统310中的多个服务模块一一对应,每个质量控制服务器320可以根据与其对应的分布式服务模块的当前系统状态,调节其服务质量级别。
例如,当前服务能力的特征值可以是分布式服务系统310的一个或多个服务模块当前所需处理的队列长度,每个质量控制服务器320可以根据特征值调整与其对应的服务模块的服务质量级别。其中,质量控制服务器320调整服务模块的服务质量级别的过程可以参见上文相关描述,这里不再赘述。
上文中已经参考附图详细描述了根据本发明的在线服务系统的服务级别控制方法与系统。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件的方式来实现,通用硬件包括通用集成电路、通用CPU、通用存储器、通用元器件等,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
因此,本发明的上述技术构思还可以被实施为一种非暂时性机器可读存储介质(或计算机可读存储介质),其上存储有可执行代码(或计算机程序/计算机指令代码)。当该可执行代码(或计算机程序/计算机指令代码)被处理器执行时,使该处理器执行上文所述的服务级别控制方法。
另一方面,本发明的上述技术构思还可以被实施为一种计算设备,该计算设备包括处理器和非暂时性机器可读存储介质(或计算机可读存储介质)。该非暂时性机器可读存储介质上存储有可执行代码(或计算机程序/计算机指令代码)。当该可执行代码(或计算机程序/计算机指令代码)被该处理器执行时,使该处理器执行上文所述的服务级别控制方法。
此外,根据本发明的方法还可以实现为一种计算机程序,该计算机程序包括用于执行本发明的上述方法中限定的上述各步骤的计算机程序代码指令。或者,根据本发明的方法还可以实现为一种计算机程序产品,该计算机程序产品包括计算机可读介质,在该计算机可读介质上存储有用于执行本发明的上述方法中限定的上述功能的计算机程序。本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。
附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (15)

1.一种在线服务系统的服务级别控制方法,其中,所述在线服务系统提供的服务质量根据系统状态被划分为多个级别,所述方法包括:
服务降级步骤,在判断所述在线服务系统的系统状态下降时,将所述在线服务系统的服务质量调低至与当前系统状态对应的级别;以及
服务恢复步骤,在判断所述系统状态上升时,暂缓将所述服务质量恢复至与当前系统状态对应的级别。
2.如权利要求1所述的方法,其中,所述服务恢复步骤包括:
在判断所述系统状态上升时,将所述服务质量恢复至比当前系统状态对应的级别要低的级别。
3.如权利要求1所述的方法,其中,所述系统状态由当前服务能力的特征值所表征,所述服务质量被划分为与多个特征值阈值相对应的多个级别,
并且其中,
所述服务降级步骤包括:
在判断所述系统状态下降使得当前特征值满足第一特征值阈值时,立刻将所述在线服务系统的服务质量调低至与所述第一特征值阈值对应的级别;以及
所述服务恢复步骤包括:
在判断所述系统状态上升使得当前特征值满足第二特征值阈值时,暂缓将所述服务质量恢复至与所述第二特征值阈值对应的级别。
4.如权利要求3所述的方法,其中,所述服务恢复步骤包括:
在判断所述系统状态上升使得当前特征值满足第二特征值阈值达预定时长时,才将所述服务质量恢复至与所述第二特征值阈值对应的级别。
5.如权利要求3所述的方法,其中,所述服务恢复步骤包括:
在判断所述系统状态上升使得当前特征值满足比所述第二特征值阈值质量级别更高的第三特征值阈值时,才将所述服务质量恢复至与所述第二特征值阈值对应的级别。
6.如权利要求3所述的方法,其中,所述服务恢复步骤包括:
在判断所述系统状态上升使得当前特征值满足对应于最佳服务质量级别的第二特征值阈值时,只有在当前特征值进一步满足比所述第二特征值表征更佳服务质量的最佳服务回归值时,才将所述服务质量恢复至所述最佳服务质量级别。
7.如权利要求3所述的方法,其中,所述当前服务能力的特征值是所述在线服务系统当前所需处理的队列长度。
8.一种在线服务质量控制系统,包括用于提供在线服务的分布式服务系统和一个或多个质量控制服务器,其中,所述一个或多个质量控制服务器用于:
获取用于表征所述分布式服务系统当前服务能力的特征值;
在当前特征值表征所述分布式服务系统的系统状态下降时,立刻将所述分布式服务系统的服务质量调低至与当前系统状态对应的级别;以及
在当前特征值表征所述系统状态上升时,暂缓将所述服务质量恢复至与当前系统状态对应的级别。
9.如权利要求8所述的控制系统,其中,所述一个或多个质量控制服务器进一步用于:
在当前特征值表征所述系统状态上升时,将所述服务质量恢复至比当前系统状态对应的级别要低的级别。
10.如权利要求8所述的控制系统,其中,所述服务质量被划分为与多个特征值阈值相对应的多个级别,并且其中,所述一个或多个质量控制服务器进一步用于:
在判断所述系统状态下降使得当前特征值满足第一特征值阈值时,立刻将所述在线服务系统的服务质量调低至与所述第一特征值阈值对应的级别;以及
在判断所述系统状态上升使得当前特征值满足第二特征值阈值时,暂缓将所述服务质量恢复至与所述第二特征值阈值对应的级别。
11.如权利要求10所述的控制系统,其中,所述一个或多个质量控制服务器进一步用于:
在判断所述系统状态上升使得当前特征值满足第二特征值阈值达预定时长时,才将所述服务质量恢复至与所述第二特征值阈值对应的级别。
12.如权利要求10所述的控制系统,其中,所述一个或多个质量控制服务器进一步用于:
在判断所述系统状态上升使得当前特征值满足比所述第二特征值阈值质量级别更高的第三特征值阈值时,才将所述服务质量恢复至与所述第二特征值阈值对应的级别。
13.如权利要求10所述的控制系统,其中,一个或多个质量控制服务器进一步用于:
在判断所述系统状态上升使得当前特征值满足对应于最佳服务质量级别的第二特征值阈值时,只有在当前特征值进一步满足比所述第二特征值表征更佳服务质量的最佳服务回归值时,才将所述服务质量恢复至所述最佳服务质量级别。
14.如权利要求10所述的控制系统,其中,所述当前服务能力的特征值是所述分布式服务系统当前所需处理的队列长度。
15.如权利要求10所述的控制系统,其中,所述当前服务能力的特征值是所述分布式服务系统的一个或多个服务模块当前所需处理的队列长度,
并且所述一个或多个质量控制服务器根据所述特征值调整所述一个或多个服务模块的服务质量级别。
CN201710443789.1A 2017-06-13 2017-06-13 在线服务系统的服务级别控制方法与系统 Pending CN107317702A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710443789.1A CN107317702A (zh) 2017-06-13 2017-06-13 在线服务系统的服务级别控制方法与系统
PCT/CN2018/090613 WO2018228323A1 (zh) 2017-06-13 2018-06-11 在线服务系统的服务级别控制方法与系统、可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710443789.1A CN107317702A (zh) 2017-06-13 2017-06-13 在线服务系统的服务级别控制方法与系统

Publications (1)

Publication Number Publication Date
CN107317702A true CN107317702A (zh) 2017-11-03

Family

ID=60181902

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710443789.1A Pending CN107317702A (zh) 2017-06-13 2017-06-13 在线服务系统的服务级别控制方法与系统

Country Status (2)

Country Link
CN (1) CN107317702A (zh)
WO (1) WO2018228323A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018228323A1 (zh) * 2017-06-13 2018-12-20 广东神马搜索科技有限公司 在线服务系统的服务级别控制方法与系统、可读存储介质
CN109976935A (zh) * 2019-03-14 2019-07-05 北京三快在线科技有限公司 微服务架构、微服务节点及其熔断恢复方法、装置
CN110034946A (zh) * 2019-01-03 2019-07-19 阿里巴巴集团控股有限公司 自适应服务降级方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020174219A1 (en) * 2001-05-21 2002-11-21 International Business Machines Corporation System and method for providing gracefully degraded services on the internet under overloaded conditions
CN101965007A (zh) * 2009-07-21 2011-02-02 中兴通讯股份有限公司 用于基站的拥塞控制的方法和装置
CN103023938A (zh) * 2011-09-26 2013-04-03 阿里巴巴集团控股有限公司 一种服务器集群的服务能力控制方法和系统
CN103581289A (zh) * 2012-08-09 2014-02-12 国际商业机器公司 有助于分布式计算系统的服务提供和协调的方法和系统
CN104252320A (zh) * 2013-06-26 2014-12-31 国际商业机器公司 网络附接存储中的高弹性协议服务
CN104636213A (zh) * 2013-11-15 2015-05-20 上海信游网络科技有限公司 一种增强soa可生存性的降级服务替换技术

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020025476A (ko) * 2000-09-29 2002-04-04 윤종용 지.피.알.에스 단말기에서 발열현상에 따른 서비스 클래스변경장치 및 방법
US7353269B2 (en) * 2000-12-21 2008-04-01 Fujitsu Limited Network monitoring system
CN102869046A (zh) * 2011-07-08 2013-01-09 杭州海康威视数字技术股份有限公司 无线网络中视频传输方法及其装置
CN104394484A (zh) * 2014-11-12 2015-03-04 海信集团有限公司 一种无线实时流媒体传输方法
CN104506609B (zh) * 2014-12-22 2018-03-27 合一网络技术(北京)有限公司 自动监测服务器状态并自适应调整服务的方法及其装置
GB2541733B (en) * 2015-08-28 2019-02-13 Imagination Tech Ltd Bandwidth Management
CN107317702A (zh) * 2017-06-13 2017-11-03 广东神马搜索科技有限公司 在线服务系统的服务级别控制方法与系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020174219A1 (en) * 2001-05-21 2002-11-21 International Business Machines Corporation System and method for providing gracefully degraded services on the internet under overloaded conditions
CN101965007A (zh) * 2009-07-21 2011-02-02 中兴通讯股份有限公司 用于基站的拥塞控制的方法和装置
CN103023938A (zh) * 2011-09-26 2013-04-03 阿里巴巴集团控股有限公司 一种服务器集群的服务能力控制方法和系统
CN103581289A (zh) * 2012-08-09 2014-02-12 国际商业机器公司 有助于分布式计算系统的服务提供和协调的方法和系统
CN104252320A (zh) * 2013-06-26 2014-12-31 国际商业机器公司 网络附接存储中的高弹性协议服务
CN104636213A (zh) * 2013-11-15 2015-05-20 上海信游网络科技有限公司 一种增强soa可生存性的降级服务替换技术

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018228323A1 (zh) * 2017-06-13 2018-12-20 广东神马搜索科技有限公司 在线服务系统的服务级别控制方法与系统、可读存储介质
CN110034946A (zh) * 2019-01-03 2019-07-19 阿里巴巴集团控股有限公司 自适应服务降级方法和装置
CN109976935A (zh) * 2019-03-14 2019-07-05 北京三快在线科技有限公司 微服务架构、微服务节点及其熔断恢复方法、装置
CN109976935B (zh) * 2019-03-14 2020-09-04 北京三快在线科技有限公司 微服务架构、微服务节点及其熔断恢复方法、装置

Also Published As

Publication number Publication date
WO2018228323A1 (zh) 2018-12-20

Similar Documents

Publication Publication Date Title
JP6457447B2 (ja) データセンターのネットワークトラフィックスケジューリング方法及び装置
KR102157722B1 (ko) 클라우드 모니터링을 기반으로 한 부하 분산 최적화 방법 및 장치
CN107317702A (zh) 在线服务系统的服务级别控制方法与系统
CN103425535B (zh) 云环境下的敏捷弹性伸缩方法
CN106933662A (zh) 分布式系统及其调度方法和调度装置
CN108600005A (zh) 一种防御微服务雪崩效应的方法
CN111506423A (zh) 一种资源的调度方法、装置、电子设备及存储介质
CN108270805B (zh) 用于数据处理的资源分配方法及装置
CN106776025A (zh) 一种计算机集群作业调度方法及其装置
CN109992392B (zh) 一种资源部署方法、装置及资源服务器
CN108241350A (zh) 一种智能动态制造执行方法及相关设备
CN106572137A (zh) 一种分布式服务资源管理方法和装置
CN115878329A (zh) 宿主机资源调度方法、装置、电子设备和存储介质
CN114448989B (zh) 调整消息分发的方法、装置、电子设备、存储介质及产品
CN106445936A (zh) 一种数据处理方法及设备
CN106302241A (zh) 在线消息队列调度方法和装置
CN108810992B (zh) 一种网络切片的资源控制方法和装置
CN108023936A (zh) 一种分布式接口访问控制方法及系统
CN108228346A (zh) 服务系统及其控制方法
CN106126339B (zh) 资源调整方法和装置
CN107092551A (zh) 一种服务器系统性能优化方法及装置
CN114726860B (zh) 一种面向流媒体传输的负载均衡系统及负载均衡方法
CN111158896A (zh) 一种分布式进程调度方法及系统
CN110868304B (zh) 一种pcc策略下发方法及系统
CN114971606A (zh) 一种用于优先成功的动态支付路由方法、系统及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171103

RJ01 Rejection of invention patent application after publication