CN103580902A

CN103580902A - 一种计算机信息系统及其动态容灾方法

Info

Publication number: CN103580902A
Application number: CN201210277988.7A
Authority: CN
Inventors: 王旭新; 薛鹏
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2012-08-07
Filing date: 2012-08-07
Publication date: 2014-02-12
Anticipated expiration: 2032-08-07
Also published as: US20140047264A1; CL2015000282A1; WO2014023174A1; EP2883329B1; KR20150032346A; PH12015500177A1; JP2015526815A; EP2883329A1; US9262287B2; EP2883329A4; PH12015500177B1; CN103580902B

Abstract

本申请公开了一种计算机信息系统及其动态容灾方法，包括：按照服务类别划分的两个以上的服务集群，所述每一服务集群中包括两个以上的服务节点；每个服务节点具备本系统内的所有服务类型的服务处理逻辑；还包括动态容灾节点，用于设置所述各服务集群的动态容灾策略，监测所述各服务集群的运行状况；在各服务集群都运行正常的情况下，根据所述动态容灾策略，将各服务类别的服务请求调度到该服务类别对应的服务集群进行响应处理；在某个服务集群运行异常的情况下，根据该服务集群的所述动态容灾策略，对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整。利用本发明，可以提高计算机信息系统的健壮性。

Description

一种计算机信息系统及其动态容灾方法

技术领域

本申请涉及计算机信息处理技术领域，尤其涉及一种计算机信息系统及其动态容灾方法。

背景技术

在计算机信息系统中，为了保证信息服务的安全性和稳定性，需要建立两套或多套功能相同的服务处理系统，在这些两套或多套的服务处理系统之间可以实现功能容灾，即当一个服务处理系统发生问题，则可以由另外的服务处理系统来对外提供服务，因此可以保证对外服务的安全性和稳定性。容灾是系统高可用性技术的一个重要组成部分，需要预先考虑到外界环境或突发事件对系统的影响，避免灾难发生时系统无法提供服务或数据丢失。所谓的灾难是指机器硬件故障、网络故障、程序崩溃、突发事件导致过载等无法提供正常服务的事件。

目前业界通常在计算机系统的组成和服务架构上实现容灾方案。

图1为现有技术一的一种互联网服务系统架构的示意图。参见图1，所述互联网服务系统就是计算机信息系统的一种具体应用领域，该架构中，所有服务节点对等，例如图1中具有101、102、和103三个对等的服务节点，每个服务节点同时对外提供所有服务（假定服务类别分为A、B、C三类）的处理逻辑，这些对等的服务节点组成了一个服务集群。图1所述的系统架构目前被许多网站采用，其容灾原理是客户端发起一种类型的服务请求后，通过系统的传输控制协议（TCP，Transmission ControlProtocol）层的负载均衡系统将该服务请求随机分配到所述服务集群中的某一个服务节点上，由该服务节点响应该服务请求。当某个服务节点发生灾难事件如硬件故障时，则服务请求会分配给其它运行正常的服务节点进行响应。

图2为现有技术二的一种互联网服务系统架构的示意图。参见图2，该架构中，按照服务类型划分成三个服务集群，每个服务集群内部的所有服务节点只提供一种固定类型的服务，在一个服务集群内部的服务节点是对等的。例如图2中所述服务集群201提供A类的服务，服务集群202提供B类的服务，服务集群203提供C类的服务。以服务集群201为例，其中的每个服务节点211、212、213都只具备A类服务的处理逻辑，客户端中设置有每种类型服务对应的服务集群的地址，当客户端发起A类服务的服务请求后，该A类服务请求发送到服务集群201，然后由TCP层的负载均衡系统将该服务请求随机分配到该服务集群201中的某一个服务节点上，由该服务节点响应该服务请求。当服务集群201中的某个服务节点发生灾难事件如硬件故障时，则A类服务请求会分配给其它运行正常的服务节点进行响应。图2所述的系统架构目前通常被许多互联网游戏业务系统所采用。

但是，上述现有技术存在如下技术问题：

整个计算机信息系统的健壮性差。例如在现有技术一中，如果所述服务集群内部故障的服务节点达到一定数目，系统实际负载大于正常工作的服务节点能承受的负载时，系统会因过载而导致整体不可用。在现有技术二中，虽然将不同类型的服务采用不同的服务集群分散处理，但是每个服务集群内部也存在跟现有技术一同样的健壮性差的问题，即如果一个服务集群内部故障的服务节点达到一定数目，在该服务集群的实际负载大于正常工作的服务节点能承受的负载时，该服务集群会因过载而导致整体不可用，从而导致无法对外提供对应类型的服务。

发明内容

有鉴于此，本发明的主要目的在于提供一种计算机信息系统及其动态容灾方法，以提高计算机信息系统的健壮性。

本发明的技术方案是这样实现的：

一种计算机信息系统，包括：

按照服务类别划分的两个以上的服务集群，所述每一服务集群中包括两个以上的服务节点；每个服务节点具备本系统内的所有服务类型的服务处理逻辑，所述服务处理逻辑用于响应到达本服务集群的服务请求；

动态容灾节点，用于设置所述各服务集群的动态容灾策略，监测所述各服务集群的运行状况；在各服务集群都运行正常的情况下，根据所述动态容灾策略，将各服务类别的服务请求调度到该服务类别对应的服务集群进行响应处理；在某个服务集群运行异常的情况下，根据该服务集群的所述动态容灾策略，对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整。

一种计算机信息系统的动态容灾方法，包括：

按照服务类别划分两个以上的服务集群，在所述每一服务集群中设置两个以上的服务节点；每个服务节点设置本系统内的所有服务类型的服务处理逻辑；

设置所述各服务集群的动态容灾策略；

监测所述各服务集群的运行状况，在各服务集群都运行正常的情况下，根据所述动态容灾策略，将各服务类别的服务请求调度到该服务类别对应的服务集群进行响应处理；在某个服务集群运行异常的情况下，根据该服务集群的所述动态容灾策略，对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整。

与现有技术相比，本发明按照服务类别划分为两个以上的服务集群，在所述每一服务集群中设置两个以上的服务节点；每个服务节点都是对等节点，即都要设置本系统内的所有服务类型的服务处理逻辑；同时，设置所述各服务集群的动态容灾策略，在各服务集群都运行正常的情况下，将各服务类别的服务请求调度到该服务类别固定对应的服务集群进行响应处理；在某个服务集群运行异常的情况下，根据该服务集群的所述动态容灾策略，对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整。这样，整个计算机信息系统内的所有服务节点都是对等的，可以根据各服务集群的运行状况，动态调整相应服务集群对服务请求的响应方式，即使某个服务集群内的故障服务节点达到一定数目而不能提供对外服务时，也可以将该服务集群对应的响应的服务请求转移到其它运行正常的服务集群上，因此整个计算机信息系统对外提供的服务并不会轻易中断，提高了计算机信息系统的健壮性。

附图说明

图1为现有技术一的一种互联网服务系统架构的示意图；

图2为现有技术二的一种互联网服务系统架构的示意图；

图3为本发明所述计算机信息系统动态容灾方法的一种流程图；

图4为本发明所述计算机信息系统的一种组成架构示意图；

图5为本发明所述计算机信息系统的又一种组成架构示意图。

具体实施方式

下面结合附图及具体实施例对本发明再作进一步详细的说明

图3为本发明所述计算机信息系统动态容灾方法的一种流程图。参见图3，本发明的计算机信息系统的动态容灾方法包括：

301、按照服务类别划分两个以上的服务集群，在所述每一服务集群中设置两个以上的服务节点；每个服务节点设置本系统内的所有服务类型的服务处理逻辑，以响应到达本服务集群的服务请求；

302、设置所述各服务集群的动态容灾策略；

303、监测所述各服务集群的运行状况，在各服务集群都运行正常的情况下，根据所述动态容灾策略，将各服务类别的服务请求调度到该服务类别对应的服务集群进行响应处理；在某个服务集群运行异常的情况下，根据该服务集群的所述动态容灾策略，对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整。

与本发明所述的方法对应，本发明还公开了一种计算机信息系统。

图4为本发明所述计算机信息系统的一种组成架构示意图。参见图4，本发明的计算机信息系统包括：

按照服务类别划分的两个以上的服务集群，例如图3中为三个服务集群401、402、和403，所述每一服务集群中包括两个以上的服务节点；每个服务节点具备本计算机信息系统内的所有服务类型的服务处理逻辑，所述服务处理逻辑用于响应到达本服务集群的服务请求。即本发明所述的所有服务集群中的所有的服务节点在功能上都是对等的，不论哪种类型的服务请求（例如图3中假设分为A、B、C三种服务类型），所述任一个服务节点都能够进行该服务请求的响应处理。

除了所述服务集群，本发明的计算机信息系统还包括动态容灾节点，即图4中的所述D节点404，该动态容灾节点用于设置所述各服务集群的动态容灾策略，监测所述各服务集群的运行状况；在各服务集群都运行正常的情况下，根据所述动态容灾策略，将各服务类别的服务请求调度到该服务类别对应的服务集群进行响应处理；在某个服务集群运行异常的情况下，根据该服务集群的所述动态容灾策略，对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整。

所述动态容灾节点的数量可以为一个，也可以为两个或两个以上，如图5为本发明所述计算机信息系统的又一种组成架构示意图，其中包括可以相互备份和相互容灾切换的主动态容灾节点541和备动态容灾节点542，所述主动态容灾节点541和备动态容灾节点542组成了一个提供动态容灾服务的容灾服务集群504。在正常情况下，由其中的主动态容灾节点提供动态容灾服务，当主动态容灾节点运行异常时，可以切换到备动态容灾节点继续运行，该备动态容灾节点切换为主动态容灾节点，前述的主动态容灾节点切换为备动态容灾节点，从而进一步提高整个系统的健壮性。

所述动态容灾策略可以预先设置，具体设置的动态容灾策略内容可以有多种，下面实施例做具体介绍。

所述动态容灾策略中可以包括的策略为：在各服务集群都运行正常的情况下，各服务类别的服务请求由该服务类别固定对应的服务集群进行响应处理。如图4和图5所示，在各服务集群都运行正常的情况下，所述服务集群401只对外提供A类型的服务，服务集群402只对外提供B类型的服务，服务集群403只对外提供C类型的服务。这种固定的对应关系属于所述动态容灾策略信息中的一部分，需要预先设置好，具体内容包括每个服务类型与其对应的服务集群地址的对应关系。在某个服务集群运行异常的情况下，则需要对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整，具体的调整指令信息也属于所述动态容灾策略的一部分，而且通常每种服务类型的服务集群都会有对应的包括所述调整指令的动态容灾策略。

所述步骤303中，所述监测各服务集群的运行状况的具体方法可以有多种，例如典型的两种为：

第一种监测方法为：由所述各服务集群中的各服务节点定时（例如每隔T1秒）向所述动态容灾节点上报自身的负载信息，所述负载信息可以包括常规的负载信息，例如CPU占用量、网络占用量等。动态容灾节点根据上报情况以及上报的负载信息判断各服务集群的运行状况。例如，所述上报情况是指所述服务节点是否每隔T1秒就上报一次负载信息，如果上报的次数或频率少于指定的值则判定该服务节点异常；然后根据上报的负载信息判断服务节点的负载是否超过指定的值，如果超过则判定该服务节点运行异常；最后判断每个服务集群内部的异常服务节点的数量是否超过指定的值，如果超过则判定该服务集群运行异常，否则判定该服务集群运行正常。

或者，第二种监测方法为：由请求服务的客户端定时（例如每隔T2秒）向动态容灾节点上报各类服务请求的数量和响应状况，动态容灾节点根据所上报的各类服务请求的数量和响应状况判断对应类别的服务集群的运行状况。例如如果某种服务类型的服务请求中发生响应失败的数量超过指定的阈值，则判定该服务类型固定对应的服务集群运行异常，否则可以判定该服务类型对应的服务集群运行正常。

通过上述监测方法，所述动态容灾节点可以随时监测到各个服务集群的运行状况，并根据运行状况和各服务集群对应的动态容灾策略进行调整。

本发明可以将所述每种服务类型及其对应的服务集群地址的对应关系信息设置在各客户端，例如具体可以预先设置在客户端，或者在系统启动后由所述动态容灾节点发送给各客户端。在计算机信息系统初始启动后，默认各服务集群都运行正常，这时如果客户端发起某种类型的服务请求，则根据所述对应关系，将该服务类型的服务请求发送到其对应的服务集群地址进行响应处理。例如A类服务请求发送给A类服务集群，B类服务请求发送给B类服务集群，C类服务请求发送给C类服务集群。所述收到服务请求的服务集群通过内部的TCP层采用负载均衡的方式将所述服务请求随机分配到某一个服务节点中，由该服务节点对该服务请求进行响应处理。当某个服务节点发生灾难事件如硬件故障时，则服务集群会将收到的服务请求分配给其它运行正常的服务节点进行响应处理。

在系统启动运行后，动态容灾节点会通过上述的监测方法监测各个服务集群的运行状况，如果监测到某个服务集群运行异常，则根据该服务集群的所述动态容灾策略，对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整。

本发明中，还提出按照可降级服务维度划分的服务类别的技术方案。上述所述按照服务类别划分服务集群，所述不同的服务类别之间是用可降级服务维度来区分的。所述可降级服务是指：该服务逻辑的部分模块出现故障时，依然能够为用户提供部分服务来满足用户的核心需求，例如互联网站用户的登录、查看个人信息等需求，则可称该服务为可降级服务。所述可降级服务维度，是评价可降级服务可接受的降级幅度，可接受的降级幅度越大，其可降级服务维度越高。

例如，上述所提到的A、B、C类服务可以按照用户影响、收入影响来划分并考虑可降级服务的应用场景。以常见的互联网服务为例，A类服务为核心体验服务，属于必须内容，用户无法接受该类服务出现问题，例如登录操作等，其可降级服务维度最低；B类服务为用户有损价值服务，用户能接受该类服务在较短的时间不可用，例如查看好友的主页、上传或下载文件等服务，该类服务的可降级服务维度较A类服务稍高一级；C类服务为可有损体验服务，该类服务只影响用户体验，即使较长时间内没办法修复也不会有大的影响，该类服务的可降级服务维度最高。

如上所述，所述A、B、C类服务根据可降级服务维度由低到高排列。在动态调整服务请求的响应服务集群和/或响应方式时，可以根据不同的可降级服务维度进行处理。

例如，所述在某个服务集群运行异常的情况下，所述动态容灾节点根据该服务集群的动态容灾策略，对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整的具体方式中，包括以下判断处理步骤：

判断其它运行正常的服务集群的负载情况是否可以承受所述发生异常的服务集群对应类别的服务请求的负载，如果是则调度所述运行正常的服务集群来响应所述发生异常的服务集群对应类别的服务请求；否则，针对可降级服务维度比发生异常的服务集群高的服务集群，停止其中的服务集群对其对应类别的服务请求的响应处理，再重复执行本判断处理步骤。

例如如图4和图5所示，如果动态容灾节点通过监测发现A类服务集群运行异常，则该动态容灾节点首先判断其它运行正常的服务集群（例如此处为B类服务集群和C类服务集群）的负载情况是否可以承受本因由A类服务集群对应响应的A类服务请求的负载，例如具体可以按照所述服务节点或客户端上报的信息来判断，具体的判断方式可以利用现有技术。

如果B、C类服务集群可以承受所述A类服务请求的负载，则调度所述运行正常的B、C类服务集群来响应所述A类服务请求，例如具体可以是将来自客户端的A类服务请求平均分布到B、C类服务集群的每个服务节点上进行响应处理。

如果B、C类服务集群可以承受所述A类服务请求的负载，由于B、C类服务集群的可降级服务维度比A类服务集群的可降级服务维度高，则可以调整B、C类服务集群的对其服务请求的响应，例如具体是停止这些可降级服务维度高的服务集群对其对应类别的服务请求的响应处理。如果其可降级服务维度比发生异常的服务集群高的服务集群只有一个，则直接停止该服务集群对其对应类别的服务请求的响应处理。如果其可降级服务维度比发生异常的服务集群高的服务集群有两个以上时，例如此处的B、C类服务集群的可降级维度都比A类服务集群高，则属于这种情况。在这种情况下，先停止其中的最高级可降级服务维度的服务集群（如此处是C类服务集群）对其对应类别的服务请求的响应处理，再重复执行所述判断处理步骤；如果所述运行正常的服务集群（此处是B和C类服务集群）的负载情况依然不可以承受所述发生异常的服务集群对应类别的服务请求的负载，则再停止低一级可降级服务维度的服务集群（例如此处是B类服务集群）对其对应类别的服务请求的响应处理。如果其可降级服务维度比发生异常的A类服务集群高的服务集群有三个以上，则再重复执行所述判断处理步骤，直到所述运行正常的服务集群的负载情况可以承受所述A类服务请求的负载，或者直到可降级服务维度比A类服务集群高的所有服务集群都被停止对其对应类别的服务请求的响应处理。

在互联网信息服务中，有一种可以离线响应的服务，其服务数据更新并不频繁，因此可以存储在服务端，也可以存储在客户端，该类服务的服务请求可以由服务端来响应处理，也可以由客户端利用存储在客户端中的数据进行离线响应处理。例如，对于一些基于关系链的互联网服务就是属于这种可以离线响应的服务，当关系链出现故障或者压力过大时，可以启用本地关系链模式，客户端在每天第一次登录的时候拉取关系链数据存储到本地客户端，后续不再拉取，这样即使服务端的关系链服务不可用，则客户端也仍然可以离线响应关系链服务请求，从而保证用户可以正常使用关系链服务。

因此，在本发明的一种实施例中，如果所述可降级服务维度比发生异常的服务集群高的服务集群对应类别的服务为所述可以离线响应的服务时，例如如果上述的C类服务为可以离线响应的服务时，则停止该C类服务集群对C类服务请求的响应处理具体可以是调整该C类服务集群对C类服务请求的响应方式，例如具体为：将该C类服务请求改为离线响应方式，指示该服务请求的发起方客户端按照离线响应方式在本地处理该服务请求。

在本发明中，所述动态容灾节点对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整的具体操作中，包括：所述调度运行正常的服务集群来响应所述发生异常的服务集群对应类别的服务请求，和/或所述停止某个服务集群对其对应类别的服务请求的响应处理，和/或所述调整某类服务集群对其对应类别的服务请求的响应方式，这些方法的具体实现方式为：

a）生成包括相应服务类别的服务请求的响应服务集群地址和/或响应方式信息的调度信息。例如动态容灾节点要执行的调整操作假设为：调度B和C类服务集群来响应A类服务请求，并且要将C类服务请求的响应方式改为离线响应方式，同时停止B类服务集群对B类服务请求的响应处理，则所述调度信息中包括：A类服务请求对应的响应服务集群的地址为B和C类服务集群的地址，B类服务请求对应的响应服务集群地址为空，C类服务请求的响应方式改为离线响应。

b）将所述调度信息发送给客户端。例如具体是生成调度信息后主动发送给客户端，或者是由客户端每隔T3秒查询一次动态容灾节点，动态容灾节点将最新的调度信息以响应包的方式发送给客户端。

c）客户端根据收到的调度信息向相应的服务集群发起服务请求和/或按照所述响应方式信息处理对应的服务请求。例如根据上述步骤a）所述的调度信息，客户端将A类服务请求发送给B和C类服务集群，B类服务请求则直接放弃发送，C类服务请求由客户端本地按照离线响应方式处理。

如图4和图5所示，如果动态容灾节点通过监测发现B类服务集群运行异常，可以则同样按照上述的判断处理步骤进行处理，即：判断其它运行正常的A和C类服务集群的负载情况是否可以承受所述发生异常的B类服务集群对应的B类服务请求的负载，如果是则调度所述运行正常的A和C类服务集群来响应所述B类服务请求；否则，针对可降级服务维度比B类服务集群高的服务集群即所述C类服务集群，停止该C类服务集群对C类服务请求的响应处理，之后再判断A和C类服务集群的负载情况是否可以承受B类服务请求的负载，如果是则调度所述运行正常的A和C类服务集群来响应所述B类服务请求，否则不再处理。

另外，针对所述B类服务请求的动态容灾策略也可以有其它方式，例如判断当前是否为业务高峰期，如果是则不进行上述判断处理步骤的调整，如果当前为非高峰期，则再执行上述的判断处理步骤进行调整。

如图4和图5所示，如果动态容灾节点通过监测发现C类服务集群运行异常，可以则同样按照上述的判断处理步骤进行处理，即：判断其它运行正常的A和B类服务集群的负载情况是否可以承受所述发生异常的C类服务集群对应的C类服务请求的负载，如果是则调度所述运行正常的A和C类服务集群来响应所述C类服务请求；否则，此时由于C类服务集群的可降级服务维度已经是最高，因此只能调整该C类服务请求的响应方式，即将该C类服务请求改为离线响应方式，指示该服务请求的发起方按照离线响应方式在本地处理该服务请求。

当然，针对所述C类服务请求的动态容灾策略也可以有其它方式，例如如果动态容灾节点通过监测发现C类服务集群运行异常，则也可以直接调整该C类服务请求的响应方式，即将该C类服务请求改为离线响应方式，指示该服务请求的发起方按照离线响应方式在本地处理该服务请求。

当所述各服务集群又都恢复正常的情况下，则所述动态容灾节点继续将各服务类别的服务请求调度到该服务类别对应的服务集群进行响应处理。例如具体的方式是动态容灾节点给客户端发出服务集群运行正常的调度信息，客户端在收到该调度信息后，如果客户端发起某种类型的服务请求，则根据之前存储的每种服务类型及其对应的服务集群地址的对应关系信息，将该服务类型的服务请求发送到其对应的服务集群地址进行响应处理。例如A类服务请求发送给A类服务集群，B类服务请求发送给B类服务集群，C类服务请求发送给C类服务集群。

如上所述，本发明与现有技术相比，整个计算机信息系统内的所有服务节点都是对等的，可以根据各服务集群的运行状况，动态调整相应服务集群对服务请求的响应方式，即使某个服务集群内的故障服务节点达到一定数目而不能提供对外服务时，也可以将该服务集群对应的响应的服务请求转移到其它运行正常的服务集群上，因此整个计算机信息系统对外提供的服务并不会轻易中断，提高了计算机信息系统的健壮性，提高了对突发式负载和故障的应对能力。

另外，本发明所述各个服务节点由于都是对等的，即其中都包括相同的处理逻辑，因此本发明的可扩展性非常强。

还有，本发明可以按照可降级服务的维度对服务类型及其对应的服务集群进行分类，当某个服务集群出现异常时，优先保证可降级服务维度低的服务（即相对核心的服务）能够继续提供服务，而对于可降级服务维度高的服务（即相对有损的服务）可以进行停止或改为离线响应方式，这样可以在容灾时保证核心服务的稳定性，提高用户的满意度。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种计算机信息系统，其特征在于，包括：

2.根据权利要求1所述的系统，其特征在于，所述动态容灾节点的数量为两个或两个以上，其中包括可以相互备份和相互容灾切换的主动态容灾节点和备动态容灾节点。

3.一种计算机信息系统的动态容灾方法，其特征在于，包括：

设置所述各服务集群的动态容灾策略；

4.根据权利要求3所述的方法，其特征在于，所述服务类别为按照可降级服务维度划分的服务类别；

所述在某个服务集群运行异常的情况下，根据该服务集群的动态容灾策略，对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整，具体包括以下判断处理步骤：

判断运行正常的服务集群的负载情况是否可以承受所述发生异常的服务集群对应类别的服务请求的负载，如果是则调度所述运行正常的服务集群来响应所述发生异常的服务集群对应类别的服务请求；否则，针对可降级服务维度比发生异常的服务集群高的服务集群，停止其中的服务集群对其对应类别的服务请求的响应处理，再重复执行本判断处理步骤。

5.根据权利要求4所述的方法，其特征在于，所述可降级服务维度比发生异常的服务集群高的服务集群有两个以上时，则所述停止其中的服务集群对其对应类别的服务请求的响应处理，具体包括：

先停止其中的最高级可降级服务维度的服务集群对其对应类别的服务请求的响应处理，再重复执行所述判断处理步骤；如果所述运行正常的服务集群的负载情况依然不可以承受所述发生异常的服务集群对应类别的服务请求的负载，则再停止低一级可降级服务维度的服务集群对其对应类别的服务请求的响应处理，再重复执行所述判断处理步骤，直到所述运行正常的服务集群的负载情况可以承受所述发生异常的服务集群对应类别的服务请求的负载，或者直到可降级服务维度比发生异常的服务集群高的所有服务集群都被停止对其对应类别的服务请求的响应处理。

6.根据权利要求4或5所述的方法，其特征在于，所述可降级服务维度比发生异常的服务集群高的服务集群对应类别的服务为可以离线响应的服务时，则停止该服务集群对其对应类别的服务请求的响应处理，具体包括：

将该服务集群对应类别的服务请求改为离线响应方式，指示该服务请求的发起方按照离线响应方式在本地处理该服务请求。

7.根据权利要求3所述的方法，其特征在于，所述运行异常的服务集群对应类别的服务为可以离线响应的服务时，则：所述在该服务集群运行异常的情况下，根据该服务集群的所述动态容灾策略，对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整，包括：

调整所述运行异常的服务集群对应类别的服务请求的响应方式，具体为：将该运行异常的服务集群对应类别的服务请求改为离线响应方式，指示该服务请求的发起方按照离线响应方式在本地处理该服务请求。

8.根据权利要求3所述的方法，其特征在于，所述监测各服务集群的运行状况，具体包括：

由所述各服务集群中的各服务节点定时上报自身的负载信息，根据上报情况以及上报的负载信息判断各服务集群的运行状况；

或者，由请求服务的客户端定时上报各类服务请求的数量和响应状况，根据所上报的各类服务请求的数量和响应状况判断对应类别的服务集群的运行状况。

9.根据权利要求3至8任一项所述的方法，其特征在于，所述将各服务类别的服务请求调度到该服务类别对应的服务集群进行响应处理，具体包括：

将各种服务类型及其对应的服务集群地址的对应关系信息设置在客户端，客户端发起某种类型的服务请求时，根据所述对应关系，将该服务类型的服务请求发送到其对应的服务集群地址进行响应处理。

10.根据权利要求3至8任一项所述的方法，其特征在于，所述对相应服务类别的服务请求的响应服务集群和/或响应方式进行动态调整，具体为：

生成包括相应服务类别的服务请求的响应服务集群地址和/或响应方式信息的调度信息，将所述调度信息发送给客户端，客户端根据收到的调度信息向相应的服务集群发起服务请求和/或按照所述响应方式信息处理对应的服务请求。