WO2023082765A1

WO2023082765A1 - 服务器状态控制方法、系统及存储介质

Info

Publication number: WO2023082765A1
Application number: PCT/CN2022/114281
Authority: WO
Inventors: 王林翰
Original assignee: 中兴通讯股份有限公司
Priority date: 2021-11-12
Filing date: 2022-08-23
Publication date: 2023-05-19
Also published as: CN116126618A

Abstract

本申请公开了一种服务器状态控制方法、系统及存储介质，其中，服务器状态控制方法应用于内容分发网络中的服务器状态控制系统，方法包括：获取处于隔离状态的第一服务器的健康值，健康值表征服务器的服务质量(S210)；将健康值大于预设健康阈值的第一服务器确定为处于恢复状态的第二服务器(S220)；逐步增加第二服务器的业务权重，直至业务权重达到预设权重，且在逐步增加业务权重过程中健康值均大于预设健康阈值，将第二服务器确定为处于正常服务状态的第三服务器(S230)。

Description

服务器状态控制方法、系统及存储介质

相关申请的交叉引用

本申请基于申请号为202111342245.9、申请日为2021年11月12日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及内容分发网络流量调度领域，例如涉及一种服务器状态控制方法、系统及存储介质。

背景技术

在内容分发网络中，大部分的故障都是由于网络环境暂时故障，或者负载率过高响应速度不够造成的，现有一种隔离恢复机制，通过带宽利用率等参数，计算服务器负载，对比设定的阈值，判断服务器服务质量是否达标，从而对服务器进行隔离或恢复操作。

但一些情形下的恢复机制，当被隔离服务器的具体指标达到阈值时，则认为该被隔离服务器已经恢复正常服务功能，直接将隔离服务器设置为正常服务状态，并根据其预配置的业务权值分配业务量，容易出现服务器因被调入业务量过多，而使得刚恢复为正常服务状态的服务器再次进入隔离状态的问题，导致服务器的资源利用率低。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本申请实施例提供一种服务器状态控制方法、系统及存储介质，能够减少出现刚恢复为正常服务状态的服务器再次进入隔离状态的问题，从而提高服务器资源的利用率。

需要说明的是，本申请中所提到的健康值为表征服务器的服务质量的一种指标，服务器对应的健康值大于预设健康阈值，则认为服务器也处于服务质量达标状态或健康状态，能为连接的用户提供高质量的服务。

第一方面，本申请实施例提供了一种服务器状态控制方法，应用于内容分发网络中的服务器状态控制系统，所述方法包括：获取处于隔离状态的第一服务器的健康值，所述健康值表征服务器的服务质量；将所述健康值大于预设健康阈值的所述第一服务器确定为第二服务器，所述第二服务器为处于恢复状态的服务器；逐步增加所述第二服务器的业务权重，直至所述业务权重达到预设权重，且在逐步增加所述业务权重过程中所述健康值均大于所述预设健康阈值，将所述第二服务器确定为第三服务器，所述第三服务器为处于正常服务状态的服务器。

第二方面，本申请实施例提供了一种服务器状态控制系统，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面任意一项实施例所述的服务器状态控制方法。

第三方面，本申请实施例提供了一种计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行如第一方面任意一项所述实施例所述的服务器状态控制方法。

本申请的其它特征和优点将在随后的说明书中阐述，并且，本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本申请技术方案的进一步理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本申请的技术方案，并不构成对本申请技术方案的限制。

图1是本申请一个实施例提供的服务器状态控制系统的架构框图；

图2是本申请另一个实施例提供的服务器状态控制方法的步骤流程图；

图3是本申请另一个实施例提供的服务器状态控制方法的步骤流程图；

图4是本申请另一个实施例提供的服务器状态控制方法的步骤流程图；

图5是本申请另一个实施例提供的服务器状态控制方法的步骤流程图；

图6是本申请另一个实施例提供的服务器状态控制方法的步骤流程图；

图7是本申请另一个实施例提供的服务器状态控制方法的步骤流程图；

图8是本申请另一个实施例提供的服务器状态控制方法的步骤流程图；

图9是本申请另一个实施例提供的服务器状态控制方法的步骤流程图；

图10是本申请另一个实施例提供的服务器状态控制方法的步骤流程图；

图11是本申请另一个实施例提供的在内容分发网络中进行服务器状态控制方法进行服务器状态控制的实例图；

图12是本申请另一个实施例提供的在内容分发网络中进行服务器状态控制方法进行服务器状态控制的实例图；

图13是本申请另一个实施例提供的服务器状态控制系统的示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

需要说明的是，虽然在系统示意图中进行了功能模块划分，在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于系统中的模块划分，或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

本申请实施例包括一种服务器状态控制方法、系统及存储介质，其中，服务器状态控制方法应用于内容分发网络中的服务器状态控制系统，方法包括：获取处于隔离状态的第一服务器的健康值，健康值表征服务器的服务质量；将健康值大于预设健康阈值的第一服务器确定为第二服务器，第二服务器为处于恢复状态的服务器；逐步增加第二服务器的业务权重，直至业务权重达到预设权重，且在逐步增加业务权重过程中健康值均大于预设健康阈值，将第二服务器确定为第三服务器，第三服务器为处于正常服务状态的服务器。根据本申请实施例提供的方案，能根据服务器对应的健康值和权重，在对恢复状态中一个或多个服务器进行恢复过程中，逐步提高服务器对应权重，分多次为恢复中的服务器分配用户，使恢复中的服务器也处于服务质量达标状态，提高整个内容分发网络中服务质量达标服务器占比，提高网络服务质量。

需要说明的是，本申请提出的服务器状态控制方法本质是为了使内容分发网络能更好的进行流量调度，在内容分发网络的正常运行过程中，由于服务器所在当地的网络环境，服务器自身资源占用情况，服务器其他突发情况等的影响，会导致该服务器的服务质量较差的“不健康状态”，而与之相对的，能够提供较好的服务质量的服务器状态称之为“健康状态”。为了保证在内容分发网络中的服务器均为健康状态，从而为用户提供良好的内容服务，需要对于整个网络中的服务器的服务质量进行评价，并通过该评价结果进行流量调度，将部分不健康服务器隔离，将恢复健康的服务器恢复服务，从而保证网络的流畅运行和良好的服务质量。

下面结合附图，对本申请实施例作进一步描述。

参考图1，本申请的一实施例提供了一种基于内容分发网络的服务器状态控制系统的具体架构。服务器状态控制系统包括:硬件层、数据层、数据预处理层、算法执行层以及主控层。服务器状态控制系统用于处理数据自产生至预测结果所有步骤，且服务器状态控制系统每一层级均具有独立的数据格式校验算法，数据完整性校验算法，数据补全算法，能够极大提升系统的鲁棒性。

其中，硬件层由内容分发网络中的服务器构成，能够根据服务器在网络中的服务情况，将位于整个调度系统网络中的服务器分为正常服务分组、隔离分组和恢复分组，其中正常服务分组包括处于正常服务状态的服务器，隔离分组包括处于隔离状态的服务器，恢复分组包括处于恢复状态的服务器。

需要说明的是，正常服务分组中服务器在内容分发网络中承担正常服务功能，为用户提供流量；隔离分组中服务器为健康值小于预设健康阈值的服务器，同时，隔离分组中服务器在被设置为隔离状态后，将该服务器下所连接的用户终端分配至正常服务分组中处于正常服务器状态的服务器；恢复分组中服务器为隔离分组中的健康值大于预设健康阈值的服务器。可以想到的是，隔离分组服务器在被隔离后，服务器控制系统将定期对隔离分组中的服务器进行健康值检测，当隔离分组中的服务器对应健康值大于预设健康阈值时，将该服务器纳入恢复分组进行监测。

数据层包括：服务器状态数据接口、网络状态数据接口和调度数据下发接口。

需要说明的是，服务器状态数据接口用于从各个服务器中获得服务器的底层数据，例如内容分发网络中的各个服务器的CPU负载率，内存负载率，磁盘负载率等数据；网络状态数据接口用于从各个服务器的网络端口中获得服务器和用户之间的网络情况参数，例如用户服务的5XX错误服务占比，服务器的带宽利用率，服务器的回源率等数据；调度数据下发接口用于将分组隔离、恢复模块的隔离恢复命令以及智能调度模块生成的各个服务器的权重参数下发至各个服务器中，使各个服务器在接到相应的命令后执行相应的操作，例如，调度数据下发接口向服务器下发分组的隔离命令，服务器收到分组的隔离命令后，服务器自动停止服务，并由内容分发网络的GSLB系统将该服务器上的用户请求调度至其他服务器中，相关领域技术人员可以理解的是，GSLB系统为相关领域常用技术，在此不再赘述；可以想到的是，服务器状态数据接口和网络状态数据接口进行数据采集后，将采集数据传输到数据预处理层，为后续数据预处理层根据所传输数据进行预处理操作做准备。

数据预处理层包括：数据格式化模块，数据清洗模块。可以想到的是，由于内容分发网络为一个分布式网络系统，系统中各设备的硬件设施不同，通过接口上传的数据类型存在差别，因此需要对通过接口上传的各项参数进行预处理，从接口上传的各项参数中抽取出有效数据。

需要说明的是，数据格式化模块用于从服务器状态数据接口和网络状态数据接口获取的不同条目的数据中抽取检测模块所需条目对应的数据，并将上述所需条目对应数据的数据格式重新拼接成检测模块所能处理的数据格式；数据清洗模块用于检验从从服务器状态数据接口和网络状态数据接口获取的数据的真实性和可靠性，对存在明显错误的数据进行清洗，并发送再次采集指令至数据层，使数据层对该存在明显错误的数据再次进行数据采集，及时更新该存在明显错误的数据。

算法执行层包括：检测模块，分组隔离模块，分组恢复模块，容量决策模块，智能调度模块。其中，检测模块用于得到内容分发网络中的各个服务器的健康值，分组隔离模块用于对服务器进行隔离操作，分组恢复模块用于控制隔离的服务器进行恢复操作用，容量决策模块用于控制服务器处于稳定服务状态，智能调度模块用于在内容分发网络中处于正常服务状态的服务器之间执行智能调度操作，使服务器处于均衡状态。

需要说明的是，在进行服务器状态控制的过程中，分组的恢复指令、权重设置指令以及正常服务分组设置指令均通过分组恢复模块发出，并通过数据下发接口下发至目标服务器中。

主控层包括主控模块，主控模块用于进行对服务状态控制系统的全局设置和控制。

需要说明的是，一实施例中，服务器状态控制系统还设置有主控服务器和阻抗服务器，主控服务器用于根据服务器自身产生QOS参数信息控制服务器进行隔离，阻抗服务器用于控制用户终端分配至除隔离服务器外其他服务器。

另外，参考图2，图2是本申请一个实施例提供的服务器状态控制方法的步骤流程图，该服务器状态控制方法应用于内容分发网络中的服务器状态控制系统，该服务器状态控制方法包括但不限于有以下步骤：

步骤S210，获取处于隔离状态的第一服务器的健康值，健康值表征服务器的服务质量。

需要说明的是，本申请提出的方案通过对比健康值和预设健康阈值的方式，来判断服务器所处状态，当服务器对应的健康值大于预设健康阈值时，说明服务器处于健康状态，该服务器能为连接的用户客户端提供服务质量达到预期的服务，相对的，当服务器对应的健康值小于预设健康阈值时，则说明服务器处于不健康状态，不能为连接的用户客户端提供服务质量达到预期的服务；可以理解的是，当服务器对应的健康值等于预设健康阈值时，相关领域技术人员可以根据健康阈值的实际定义，进而把健康值等于预设健康阈值的服务器归于健康状态或不健康状态中的一种，并按照相应的方法对该服务器进行处理。

需要说明的是，本实施例中服务器处于隔离状态代表该服务器为不健康服务器，该服务器在内容分发网络中不承担任何流量负载功能，以免该服务器给用户带来不良的使用体验。

值得说明的是，预设健康阈值的具体取值，取决于相关领域技术人员在实际操作过程中对内容分发网络中各服务器服务质量的预期值，相关领域技术人员可以根据内容分发网络中处于正常服务状态下的各服务器的具体运行数据设置预设健康阈值。

步骤S220，将健康值大于预设健康阈值的第一服务器确定为第二服务器，第二服务器为处于恢复状态的服务器。

需要说明的是，处于隔离状态的第一服务器不承担任何流量负载功能，随着时间的推移，处于隔离状态的第一服务器会逐渐重新获取其被消耗掉的内存、带宽等服务器资源，使该第一服务器的健康值提升，服务器状态控制系统在有第一服务器存在的情况下，将定期检测各第一服务器的健康值，当有第一服务器健康值大于预设健康阈值时，则认为该第一服务器可以在满足服务质量需求的情况下处理部分用户服务数据，同时，将该第一服务器确定为第二服务器，准备对其进行后续的恢复处理。

需要说明的是，第二服务器为处于恢复状态的服务器，而处于恢复状态则代表该服务器已经具备部分在满足服务质量需求的前提下处理用户服务数据的能力，但该能力可能还未达到处于正常服务状态的服务器的标准，因此需要根据恢复策略在分次逐步调入用户的情况下观察其健康值是否达到预设健康阈值,使其有一个恢复的过程。

步骤S230，逐步增加第二服务器的业务权重，直至业务权重达到预设权重，且在逐步增加业务权重过程中健康值均大于预设健康阈值，将第二服务器确定为第三服务器，第三服务器为处于正常服务状态的服务器。

其中，业务权重用于确定分配给业务权重对应服务器的业务量或者是用户客户端连接量，通过增加业务权重的方式，使该业务权重对应服务器被分配更多的业务，分配的业务的规模随着业务权重的增加而增加，同时分配业务增加则会使对应服务器负载增加，对应服务器的健康值也会在负载变化的影响下而波动，一般情况下，对应服务器的健康值会在负载增加的情况下降低，因此，在本步骤中，当逐步增加第二服务器的业务权重，直至业务权重达到预设权重时，其健康值若大于预设健康阈值，则说明该第二服务器具备处理正常服务状态下应当承担业务量的能力，但为了保证该第二服务器在恢复的过程中依然处于服务质量达标状态即健康状态，需要在逐步增加业务权重过程中，定期或持续检测该第二服务器对应健康值，保证在逐步增加业务权重过程中该第二服务器对应健康值均大于预设健康阈值，使在恢复状态下该第二服务器依然能为其连接的用户客户端提供服务质量满足预期的服务，减少因对服务器调入业务量过多而使得刚恢复为正常服务状态的服务器再次进入隔离状态的问题的发生，提高服务器利用率。

可以理解的是，第三服务器为处于正常服务状态的服务器，该类服务器在内容分发网络中承担正常服务功能，为用户提供流量；处于正常服务状态则说明该类服务器健康值大于预设健康阈值，该类服务器为健康服务器。

可以理解的是，本申请的发明内容主要为对内容分发网络中各类服务器状态进行控制的方法，通过更加有效的控制服务器状态改变，以达到对客户业务、服务或者是流量进行更及时的调度，减少网络拥塞的发生，提高整个内容分发网络的健壮性，其中第一服务、第二服务器和第三服务器为内容分发网络中处于不同服务状态的服务器，这种分类并不对服务器本身和内容分发网络本体构成限制。

在一实施例中，业务权重根据内容分发网络设定的调度权重和内置的权重系数得到，可以想到的是，调度权重是内容分发网络通过本身的智能调度功能确定的正常服务状态下服务器应当分配的权重，权重系数则代表恢复中服务器的恢复状态和恢复进度，在服务器恢复过程中，通过增加权重系数的方式增加业务权重，达到逐步增加服务器待处理业务量的效果，例如，将调度权重与权重系数的乘算结果确定为业务权重，根据内容分发网络的待处理的总服务量与业务权重确定对应服务器待处理业务量，相关领域技术人员可以根据实际情况设置权重系数的范围，控制服务器预期恢复效果。

另外，参考图3，在一实施例中，图2所示实施例步骤S230包括但不限于以下步骤：

步骤S310，根据预设的权重增加规则对第二服务器的业务权重进行逐步增加处理，直至业务权重达到预设权重，且在逐步增加业务权重过程中健康值均大于预设健康阈值，将第二服务器确定为第三服务器。

需要说明的是，通过预设的权重增加规则对第二服务器的业务权重进行逐步增加处理，直至业务权重达到预设权重，其中，通过预设的权重增加规则，业务权重可以采用每次增加相同的单位权重的方式进行线性增加，例如：0.1,0.2,0.3,0.4；业务权重也可以采用增加权重随着增加次数的变化而发生变化的方式进行指数增加，例如：0.1,0.2,0.4,0.7；值得说明的是业务权重在逐步增加的过程中，具体权重增加规则并不受举例限制，相关领域技术人员可以根据实际情况调整。

值得注意的是，根据预设的权重增加规则对第二服务器的业务权重进行逐步增加处理过程中，每次增加业务权重之后，应当检测第二服务器对应的健康值，确保第二服务器对应的健康值大于预设健康阈值，直至业务权重达到预设权重，代表第二服务器完全恢复，则将第二服务器确定为第三服务器，使第二服务器承担内容分发网络中的正常服务功能。

另外，参考图4，在一实施例中，图3所示实施例步骤S310包括但不限于以下步骤：

步骤S410，根据预设的权重增加规则对第二服务器的业务权重增加第一单位权值，获取第二服务器的健康值。

步骤S420，在健康值大于预设健康阈值情况下，再次执行根据预设的权重增加规则对第二服务器的业务权重增加第一单位权值，获取第二服务器的健康值的步骤，直至业务权重达到预设权重，且健康值大于预设健康阈值，将第二服务器确定为第三服务器。

需要说明的是，根据预设的权重增加规则对第二服务器的业务权重增加第一单位权值，获取第二服务器的健康值，同时将每次增加第一单位权值之间的间隔确定为恢复周期，在每个恢复周期中，逐步增加服务器的业务权重，并持续检测其健康值，直到服务器的调度权重达到了正常权重且各恢复周期中健康值均高于健康值阈值，则将该第二服务器重新设置为第三服务器，其中，正常权重为内容分发网络通过智能调度模块确定的该服务器处于正常服务状态下对应的权重。

需要说明的是，本步骤中设定的第一单位权重并不限制为固定值，其可以根据权重增加规则而变化，使处于恢复状态的服务器拥有更加平稳的逐步恢复效果，减少因对服务器调入业务量过多而使得刚恢复为正常服务状态的服务器再次进入隔离状态的问题的发生。

另外，参考图5，在一实施例中，图2所示实施例还包括但不限于以下步骤：

步骤S510，获取待处理的业务总流量和每个第一服务器的服务带宽。

步骤S520，根据业务总流量和每个服务带宽得到负载指数。

步骤S530，在负载指数大于或者等于预设危险阈值情况下，将若干个第一服务器和/或若干个第二服务器确定为第三服务器。

其中，待处理的业务总流量是指整个内容分发网络需要处理的总流量，而内容分发网络的主要服务功能由处于正常服务状态的第三服务器承担，因此需获得每个第三服务器的服务带宽，来确定内容分发网络整体的负载能力，同时，可以想到的是，服务带宽只是其中一种代表服务器负载能力的指标，相关领域技术人员可以根据实际情况选择指标类型，并不对本实施例提出方案构成限制，本实施例提出方案要保护的主要内容为一种内容分发网络在特殊情况影响下，处于正常服务状态的第三服务器无法承担内容分发网络的主要服务功能，为快速提高内容分发网络整体的负载能力，提高第三服务器数量的方法。

可以想到的是，对内容分发网络中的总流量和正常服务服务器的总服务带宽进行比较得到负载指数，该负载指数能表征当前内容分发网络的负载状态，同时通过将负载指数与预设危险阈值对比，来判断内容分发网络负载是否过高。

在一实施例中，以内容分发网络中的总流量和正常服务服务器的总服务带宽进行的比例作为负载指数，若该比例达到预设危险阈值，则将若干个第一服务器和/或若干个第二服务器确定为第三服务器，来降低当前内容分发网络中各正常服务状态服务器负载，保证内容分发网络中各处于正常服务状态的服务器处于稳定服务状态。

在一实施例中，设有多个预设危险阈值，每个预设危险阈值对应不同的第一服务器和第二服务器的调度策略，例如：设有第一危险阈值A和第二危险阈值B，当负载指数到达第一危险阈值A时，只改变第二服务器的服务器状态，将若干个第二服务器确定为第三服务器，来缓解内容分发网络负载压力，当负载指数到达第二危险阈值B时，同时改变第一服务器和第二服务器的服务器状态，将若干个第一服务器和若干个第二服务器确定为第三服务器，来缓解内容分发网络负载压力；可以想到的是正常情况下，处于恢复状态的第二服务器当前能承担的负载能力一般高于处于隔离状态的第一服务器，因此优先将第二服务器确定为第三服务器，在负载指数大于等于预设危险阈值且第二服务器数量不足时，则将第一服务器确定为第三服务器，来缓解内容分发网络中各处于正常服务状态的服务器的负载压力。

另外，参考图6，在一实施例中，图5所示实施例步骤S530还包括但不限于以下步骤：

步骤S610，在负载指数大于或等于预设危险阈值情况下，获取每个第二服务器的业务权重。

步骤S620，根据业务权重确定最高的业务权重对应的第二服务器确定为第三服务器。

其中，获取代表内容分发网络整体负载的负载指数后，在负载指数大于或等于预设危险阈值的情况下，获取每个第二服务器的业务权重，并将最高的业务权重对应的第二服务器确定为第三服务器；可以想到的是，服务器对应的业务权重越高，服务器恢复的状态就越好，能更多的承担正常服务，因此优先将最高的业务权重对应的第二服务器确定为第三服务器，能在调动相同数目服务器的前提下，更多的分担处于正常服务状态的服务器的负载压力，降低负载指数，使内容分发网络能提供更稳定的服务。

在一实施例中，在一次根据业务权重确定最高的业务权重对应的第二服务器确定为第三服务器的步骤后，负载指数仍然大于或等于预设危险阈值，则继续执行根据业务权重确定最高的业务权重对应的第二服务器确定为第三服务器的步骤，直至负载指数小于预设危险阈值，保证内容服务网络能提供服务质量满足预期需求的服务。

另外，参考图7，在一实施例中，图2所示实施例还包括但不限于以下步骤：

步骤S710，获取第二服务器的健康值。

步骤S720，将健康值小于预设健康阈值的第二服务器确定为第一服务器。

其中，获取第二服务器的健康值，将健康值小于预设健康阈值的第二服务器确定为第一服务器，保证处于恢复状态的各第二服务器的健康值均大于预设健康阈值，使处于恢复状态的各第二服务器为健康服务器；可以想到的是，第二服务器代表内容分发网络中的恢复分组，为减少刚恢复为正常服务状态的服务器再次进入隔离状态的问题的出现，则需要根据健康值对其中不健康服务器进行隔离，将第二服务器确定为第一服务器，同时通过内容分发网络本身的流量调度功能，将该被隔离的第二服务器连接的用户终端分配给处于正常服务状态的各第一服务器，

另外，参考图8，在一实施例中，图2所示实施例还包括但不限于以下步骤：

步骤S810，获取第三服务器的健康值。

步骤S820，将健康值小于预设健康阈值的第三服务器确定为第一服务器。

其中，获取第三服务器的健康值，将健康值小于预设健康阈值的第三服务器确定为第一服务器，保证处于正常服务状态的各第三服务器的健康值均大于预设健康阈值，使处于正常服务状态的各第三服务器为健康服务器；可以想到的是，从设立第三服务器的初衷出发，第三服务器代表内容分发网络中的正常服务分组，为使该正常服务分中的各服务器均为健康服务器，满足内容分发网络中正常服务的质量需求，则需要根据健康值对其中不健康服务器进行隔离，将第三服务器确定为第一服务器，同时通过内容分发网络本身的流量调度功能，将该被隔离的第三服务器连接的用户终端分配给处于正常服务状态的各第一服务器，保证能对用户提供服务质量满足预期的服务。

另外，参考图9，在一实施例中，图2所示实施例中健康值的获取方法包括但不限于以下步骤：

步骤S910，获取每个服务器的用户服务数据，服务器包括至少如下之一：第一服务器，第二服务器，第三服务器。

步骤S920，根据用户服务数据得到服务质量评估结果。

步骤S930，根据服务质量评估结果得到健康值。

其中，获取内容分发网络中的每个服务器的用户服务数据，服务器包括至少如下之一：第一服务器、第二服务器以及第三服务器，可以想到的是第一服务器、第二服务器以及第三服务器只是根据服务器不同状态进行的分类，对服务器本身没有限制，因此获取每个服务器健康值的方法不会因服务器处于不同状态而发生改变。

在一实施例中，通过底层数据接口获取各个服务器的底层数据，通过网络状态数据接口获取各个服务器和用户之间的网络情况参数，同时，通过对底层数据和网络情况参数进行数据格式化和数据清洗操作得到用户服务数据。

可以想到的是，对用户服务数据进行分析得到服务质量评估结果，并根据服务质量评估结果生成表征服务器服务质量健康值为现有技术，相关领域技术人员可以根据实际情况选择不同的算法实现根据用户服务数据进行分析得到服务质量评估结果，在此不再赘述。

另外，参考图10，在一实施例中，图2至图9任意一项实施例服务器状态控制方法包括但不限于以下步骤：

步骤S1010，获取每个第三服务器的负载率；

步骤S1020，根据负载率对每个第三服务器进行均衡处理，以使第三服务器处于均衡状态。

可以想到的是，根据服务器底层数据和网络情况参数得到每个处于正常服务状态的第三服务器的负载率，其中，基于内容分发网络的本身的流量调度功能，服务器状态控制系统为内容分发网络中处于正常服务状态的第三服务器提供调度服务，同时根据每个第三服务器的负载率在每个第三服务器之间进行流量分配，对每个第三服务器对应的业务量进行均衡处理，使每个第三服务器均处于均衡状态，减少突发大流量导致部分第三服务器超负载从而导致内容分发网络崩溃的情况发生。

另外，参考图11，图11是发明另一个实施例提供的在内容分发网络中进行服务器状态控制方法进行服务器状态控制的实例图，包括但不限于以下步骤：

步骤S1110，获取内容分发网络中各服务器的底层数据；

步骤S1111，对各服对应务底层数据进行数据格式化和数据清洗，得到用户服务数据；

步骤S1112，判断是否遍历完内容分发网络中所有服务器，若否，执行步骤S1113，若是，则结束本次服务器状态控制；

步骤S1113，根据服务器对应用户服务数据得到健康值；

步骤S1114，判断服务器对应健康值是否大于预设健康阈值，若是，执行步骤S1112，若否，则执行步骤S1115；

步骤S1115，将服务器确定为处于隔离状态的第一服务器；

步骤S1116，判断第一服务器对应健康值是否大于预设健康阈值，若是，执行步骤S1117，若否，则执行步骤S1115；

步骤S1117，将第一服务器确定为处于恢复状态的第二服务器；

步骤S1118，逐步增加第二服务器对应的业务权重；

步骤S1119，判断第二服务器对应健康值是否大于预设健康阈值，若是，执行步骤S1120，若否，则执行步骤S1115；

步骤S1120，判断第二服务器对应业务权重是否到达预设权重，若是，执行步骤S1121，若否，则执行步骤S1118；

步骤S1121，将第二服务器确定为处于正常服务状态的第三服务器。

另外，参考图12，图12是发明另一个实施例提供的在内容分发网络中进行服务器状态控制方法进行服务器状态控制的实例图，包括但不限于以下步骤：

步骤S1210，获取待处理的业务总流量和每个第一服务器的服务带宽；

步骤S1211，根据业务总流量和每个服务带宽得到负载指数；

步骤S1212，判断负载指数是否大于或等于预设危险阈值，若是，执行步骤S1213，若否，则执行步骤S1210；

步骤S1213，根据业务权重将最高的业务权重对应的第二服务器确定为第三服务器；

步骤S1214，判断负载指数是否仍然大于或等于预设危险阈值，若是，执行步骤S1213，若否，则结束本次服务器状态控制。

另外，参考图13，本申请的一个实施例还提供了一种服务器状态控制系统1300，存储器1320、处理器1310及存储在存储器1320上并可在处理器1310上运行的计算机程序,处理器1310执行计算机程序时实现前述任意一项的服务器状态控制方法，例如，执行以上描述的图2中的方法步骤S210至S230、图3中的方法步骤S310、图4中的方法步骤S410至S420、图5中的方法步骤S510至S530、图6中的方法步骤S610至S620、图7中的方法步骤S710至S720、图8中的方法步骤S810至S820、图9中的方法步骤S910至S930、图10中的方法步骤S1010至S1020、图11中的方法步骤S1110至S1121、图12中的方法步骤S1210至S1214。

此外，本申请的一个实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个控制处理器执行，例如，执行以上描述的图2中的方法步骤S210至S230、图3中的方法步骤S310、图4中的方法步骤S410至S420、图5中的方法步骤S510至S530、图6中的方法步骤S610至S620、图7中的方法步骤S710至S720、图8中的方法步骤S810至S820、图9中的方法步骤S910至S930、图10中的方法步骤S1010至S1020、图11中的方法步骤S1110至S1121、图12中的方法步骤S1210至S1214。

本申请实施例包括一种服务器状态控制方法、系统及存储介质，其中，服务器状态控制方法应用于内容分发网络中的服务器状态控制系统，方法包括：获取处于隔离状态的第一服务器的健康值，健康值表征服务器的服务质量；将健康值大于预设健康阈值的第一服务器确定为第二服务器，第二服务器为处于恢复状态的服务器；逐步增加第二服务器的业务权重，直至业务权重达到预设权重，且在逐步增加业务权重过程中健康值均大于预设健康阈值，将第二服务器确定为第三服务器，第三服务器为处于正常服务状态的服务器。根据本申请实施例提供的方案，在对处于恢复状态中一个或多个服务器进行恢复过程中，逐步提高服务器对应权重，并同时根据逐步分配的权重对处于恢复状态中的服务器分配业务，能够减少出现因对服务器调入业务量过多而使得刚恢复为正常服务状态的服务器再次进入隔离状态的问题，从而提高服务器资源的利用率。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

以上是对本申请的若干实施进行了具体说明，但本申请并不局限于上述实施方式，熟悉本领域的技术人员在不违背本申请本质的前提下还可作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

一种服务器状态控制方法，应用于内容分发网络中的服务器状态控制系统，所述方法包括：

获取处于隔离状态的第一服务器的健康值，所述健康值表征服务器的服务质量；

将所述健康值大于预设健康阈值的所述第一服务器确定为第二服务器，所述第二服务器为处于恢复状态的服务器；

逐步增加所述第二服务器的业务权重，直至所述业务权重达到预设权重，且在逐步增加所述业务权重过程中所述健康值均大于所述预设健康阈值，将所述第二服务器确定为第三服务器，所述第三服务器为处于正常服务状态的服务器。
根据权利要求1的方法，其中，所述逐步增加所述第二服务器的业务权重，直至所述业务权重达到预设权重，且在逐步增加所述业务权重过程中所述健康值均大于所述预设健康阈值，将所述第二服务器确定为第三服务器，包括：

根据预设的权重增加规则对所述第二服务器的业务权重进行逐步增加处理，直至所述业务权重达到预设权重，且在逐步增加所述业务权重过程中所述健康值均大于所述预设健康阈值，将所述第二服务器确定为第三服务器。
根据权利要求2的方法，其中，所述根据预设的权重增加规则对所述第二服务器的业务权重进行逐步增加处理，直至所述业务权重达到预设权重，且在逐步增加所述业务权重过程中所述健康值均大于所述预设健康阈值，将所述第二服务器确定为第三服务器，包括：

根据预设的权重增加规则对所述第二服务器的业务权重增加第一单位权值，获取所述第二服务器的健康值；

在所述健康值大于所述预设健康阈值情况下，再次执行所述根据预设的权重增加规则对所述第二服务器的业务权重增加第一单位权值，获取所述第二服务器的健康值的步骤，直至所述业务权重达到预设权重，且所述健康值大于所述预设健康阈值，将所述第二服务器确定为第三服务器。
根据权利要求1的方法，还包括：

获取待处理的业务总流量和每个所述第一服务器的服务带宽；

根据所述业务总流量和每个所述服务带宽得到负载指数；

在所述负载指数大于或者等于预设危险阈值情况下，将若干个所述第一服务器和/或若干个所述第二服务器确定为所述第三服务器。
根据权利要求4的方法，其中，所述在所述负载指数不低于所述预设危险阈值情况下，将若干个所述第一服务器和/或若干个所述第二服务器确定为所述第三服务器，包括：

在所述负载指数不低于所述预设危险阈值情况下，获取每个所述第二服务器的业务权重；

根据所述业务权重确定最高的所述业务权重对应的所述第二服务器确定为所述第三服务器。
根据权利要求1的方法，还包括：

获取所述第二服务器的所述健康值；

将所述健康值小于预设健康阈值的所述第二服务器确定为所述第一服务器。
根据权利要求1的方法，还包括：

获取所述第三服务器的所述健康值；

将所述健康值小于预设健康阈值的所述第三服务器确定为所述第一服务器。
根据权利要求1的方法，其中，所述健康值的获取方法，包括：

获取每个服务器的用户服务数据，所述服务器包括至少如下之一：所述第一服务器，所述第二服务器，所述第三服务器；

根据所述用户服务数据得到服务质量评估结果；

根据所述服务质量评估结果得到所述健康值。
根据权利要求1至8任意一项的方法，还包括：

获取每个所述第三服务器的负载率；

根据负载率对每个所述第三服务器进行均衡处理，以使所述第三服务器处于均衡状态。
一种服务器状态控制系统，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如权利要求1至9中任意一项所述的服务器状态控制方法。
一种计算机可读存储介质，存储有计算机可执行指令，计算机可执行指令用于执行如权利要求1至9中任意一项所述的服务器状态控制方法。