CN110764963A

CN110764963A - 一种服务异常处理方法、装置及设备

Info

Publication number: CN110764963A
Application number: CN201810850578.4A
Authority: CN
Inventors: 林苏琦; 余辰侃; 张坤; 田世坤; 刘荣
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Cloud Computing Ltd
Priority date: 2018-07-28
Filing date: 2018-07-28
Publication date: 2020-02-07
Anticipated expiration: 2038-07-28
Also published as: CN110764963B

Abstract

本申请公开了一种服务异常处理方法、装置及设备。该方法包括：客户端向主节点所分配的第一服务节点发送服务请求，并监控所述第一服务节点对所述服务请求的响应状态；当监控到所述第一服务节点的响应状态异常时，向所述主节点发送第二分配请求，由主节点响应第二分配请求为客户端重新分配一与第一服务节点不同的第二服务节点，以确保客户端的正常读写。

Description

一种服务异常处理方法、装置及设备

技术领域

本申请涉及计算机技术领域，尤其涉及一种服务异常处理方法、装置及设备。

背景技术

在分布式存储系统中，一般是通过服务节点之间相互通信或者主节点(Master节点)与所有服务节点定期通信，来确定各服务节点的状态，以判断服务节点能否正常提供服务。主节点根据各服务节点的运行状态来对服务节点进行调度，将客户端发送的读写请求调度至合适的服务节点，以保证用户在复杂的网络环境中读写数据的准确性和存储模块服务的可用性。

当出现异常情况例如网络抖动、中断等而导致服务节点不可用时，需要及时感知服务节点的异常，以便对异常服务节点进行关闭、迁移读写连接等调度处理，确保用户能不间断完成正常读写数据。现有技术的服务异常处理方案存在以下缺点：

1)在大规模分布式存储系统中，服务节点的数量较多，无论是服务节点之间互相传播扩散节点状态，还是主节点轮询监控，在发生网络中断等异常情况时，均需要等待较长的超时时间来确认服务节点不可用。在这段时间内，用户的请求无法发送至相应的服务节点，影响了用户的正常读写。

2)当客户端与服务节点的网络中断、但主节点与服务节点、服务节点与服务节点之间通信正常时，服务节点之间传播扩散或主节点轮询监控的方式均无法感知到客户端与服务节点之间的通信异常，影响用户正常读写。

3)当发生网络抖动时，存在一些节点与主节点或其他服务节点仍可通信，但通信质量较差、丢包较多的情况，此时，主节点会因为与这些问题节点维持未曾间断的通信而认为这些节点仍然可用，但是，这些节点实际上已经不便于向用户提供服务。

因此，亟需一种可靠的服务异常处理方案。

发明内容

本说明书实施例提供一种服务异常处理方法、装置及设备，用以解决现有技术无法及时确定异常服务节点导致用户读写受影响的问题。

本说明书实施例采用下述技术方案：

第一方面，本说明书实施例提供一种服务异常处理方法，包括：

向第一服务节点发送服务请求，所述第一服务节点为主节点所分配；

监控所述第一服务节点对所述服务请求的响应状态；

当监控到所述第一服务节点的响应状态异常时，向所述主节点发送第二分配请求，所述第二分配请求包括所述第一服务节点的标识，以便所述主节点重分配所述第一服务节点以外的第二服务节点。

第二方面，本说明书实施例还提供一种服务异常处理方法，包括：

接收客户端发送的第一分配请求；

向所述客户端发送第一分配信息，所述第一分配信息包括第一服务节点的标识；

接收所述客户端发送的第二分配请求，所述第二分配请求为客户端监控到所述第一服务节点的响应状态异常时发送，所述第二分配请求包括所述第一服务节点的标识；

向所述客户端发送第二分配信息，所述第二分配信息包括第二服务节点的标识，其中，所述第二服务节点从所述第一服务节点以外的服务节点中确定。

第三方面，本说明书实施例还提供一种服务异常处理方法，包括：

向主节点发送第一分配请求；

接收主节点发送的第一分配信息，所述第一分配信息包括第一磁盘的标识和第一服务节点的标识；

客向所述第一服务节点发送针对所述第一磁盘的服务请求；

监控所述第一服务节点对所述服务请求的响应状态；

当监控到针对所述第一磁盘的服务请求响应状态异常时，向所述主节点发送第二分配请求，所述第二分配请求包括所述第一磁盘的标识和所述第一服务节点的标识，以便所述主节点根据所述第二分配请求来返回第二磁盘的标识，其中，所述第二磁盘与所述第一磁盘不同。

第四方面，本说明书实施例还提供一种服务异常处理方法，包括：

接收客户端发送的第一分配请求；

向所述客户端发送第一分配信息，所述第一分配信息包括第一磁盘的标识和第一服务节点的标识；

接收所述客户端发送的第二分配请求，所述第二分配信息包括所述第一磁盘的标识和第一服务节点的标识，所述第二分配请求为所述客户端监控到所述第一服务节点的响应状态异常时发送的；

向所述客户端发送第二分配信息，所述第二分配信息包括第二磁盘的标识，其中，所述第二磁盘与所述第一磁盘不同。

第五方面，本说明书实施例还提供一种服务异常处理装置，包括：

第一发送模块，用于向所述第一服务节点发送服务请求，所述第一服务节点为主节点所分配；

监控模块，用于监控所述第一服务节点对所述服务请求的响应状态；

第二发送模块，用于当监控到所述第一服务节点的响应状态异常时，向所述主节点发送第二分配请求，所述第二分配请求包括所述第一服务节点的标识，以便所述主节点重分配所述第一服务节点以外的第二服务节点。

第六方面，本说明书实施例还提供一种服务异常处理装置，包括：

第一接收模块，用于接收客户端发送的第一分配请求；

第一发送模块，用于向所述客户端发送第一分配信息，所述第一分配信息包括第一服务节点的标识；

第二接收模块，用于接收所述客户端发送的第二分配请求，所述第二分配请求为所述客户端监控到所述第一服务节点的响应状态异常时发送的，所述第二分配请求包括所述第一服务节点的标识；

第二发送模块，用于向所述客户端发送第二分配信息，所述第二分配信息包括第二服务节点的标识，其中，所述第二服务节点从所述第一服务节点以外的服务节点中确定。

第七方面，本说明书实施例还提供一种服务异常处理装置，包括：

第一发送模块，用于向主节点发送第一分配请求；

第一接收模块，用于接收主节点发送的第一分配信息，所述第一分配信息包括第一磁盘的标识和第一服务节点的标识；

第二发送模块，用于向所述第一服务节点发送针对所述第一磁盘的服务请求；

第三发送模块，用于当监控到针对所述第一磁盘的服务请求响应状态异常时，向所述主节点发送第二分配请求，所述第二分配请求包括所述第一磁盘的标识和所述第一服务节点的标识，以便所述主节点根据所述第二分配请求来返回第二磁盘的标识，其中，所述第二磁盘与所述第一磁盘不同。

第八方面，本说明书实施例还提供一种服务异常处理装置，包括：

第一接收模块，用于接收客户端发送的第一分配请求；

第一发送模块，用于向所述客户端发送第一分配信息，所述第一分配信息包括第一磁盘的标识和第一服务节点的标识；

第二接收模块，用于接收所述客户端发送的第二分配请求，所述第二分配信息包括所述第一磁盘的标识和第一服务节点的标识，所述第二分配请求为所述客户端监控到所述第一服务节点的响应状态异常时发送的；

第二发送模块，用于向所述客户端发送第二分配信息，所述第二分配信息包括第二磁盘的标识，其中，所述第二磁盘与所述第一磁盘不同。

第九方面，本说明书实施例还提供一种电子设备，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行第一方面或第三方面对应的步骤。

第十方面，本说明书实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行第一方面或第三方面对应的步骤。

第十一方面，本说明书实施例还提供一种电子设备，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行第二方面或第四方面对应的步骤。

第十二方面，本说明书实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行第二方面或第四方面对应的步骤。

本说明书实施例通过在主节点为客户端分配服务节点后，由客户端监控该服务节点对客户端的服务请求的响应状态，在监控到服务节点的响应状态异常时，向主节点发送重分配请求，以使主节点为客户端分配另一个服务节点。与现有技术中主节点轮询服务节点或者服务节点之间相互通信以确定异常的服务节点的方案相比，本方案由客户端来监控服务节点的响应状态并及时上报服务节点的异常信息，从而能够更有针对性地识别出相对于客户端异常的服务节点，有效缩短确定异常服务节点及为客户端重分配服务节点所需花费的时间，进而降低对用户读写数据造成的影响。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本说明书提供的一种应用场景的示意图；

图2为本说明书实施例1提供的客户端侧的一种服务异常处理方法的流程示意图；

图3为本说明书提供的实施例2提供的主节点侧的一种服务异常处理方法的流程示意图；

图4为本说明书提供的实施例3提供的主节点、服务节点和客户端的交互流程示意图；

图5为本说明书实施例4提供的客户端侧的一种服务异常处理方法的流程示意图；

图6为本说明书实施例5提供的服务节点侧的一种服务异常处理方法的流程示意图；

图7为本说明书实施例6提供的主节点侧的一种服务异常处理方法的流程示意图；

图8为本说明书实施例6提供的单个服务节点的读写连接迁移步骤的流程示意图；

图9为本说明书实施例7提供的客户端侧的一种服务异常处理装置的结构示意图；

图10为本说明书实施例8提供的主节点侧的一种服务异常处理装置的结构示意图；

图11为本说明书实施例9提供的客户端侧的一种服务异常处理装置的结构示意图；

图12为本说明书实施例10提供的服务节点侧的一种服务异常处理装置的结构示意图；

图13为本说明书实施例11提供的主节点侧的一种服务异常处理装置的结构示意图；

图14为本说明书实施例12提供的一种电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

结合背景技术部分陈述的内容，在云计算虚拟化环境中，一台物理机上可以创建多个虚拟机(Virtual Machine，VM)，进而可构建多虚拟机的分布式存储系统。其中，每个VM均可作为部署应用的服务器，用于存放用户数据至虚拟磁盘。

在读写过程中，用户通过客户端向分布式存储系统发送读写IO请求，由分布式存储系统中的主节点基于读写资源、磁盘信息等等，将IO请求分配给合适的服务节点，并由该服务节点为客户端提供对应的读写服务，以保证用户在复杂网络环境中读写数据的准确性；

其中，主节点为分布式存储系统中用于管控服务节点的中心模块。

但是，当分布式存储系统中存在服务节点不可用的情况时，现有技术一般是通过主节点对所有服务节点定期通信或服务节点之间相互通信，感知服务节点的状态，以确定不可用的服务节点，进而进行关闭不可用的服务节点上的读写连接、迁移读写连接等调度工作，确保用户能够不间断地完成正常地数据读写。但是，由于确定不可用的服务节点花费的时间较长，并且难以检测到与主节点或其他服务节点通信正常但是与客户端通信异常的服务节点，因此，用户的读写请求无法被转发至对应的服务节点，影响用户的正常读写。

基于此，本发明提供一种服务异常处理方法，该方法通过在主节点为客户端分配服务节点后，由客户端监控该服务节点对客户端的服务请求的响应状态，在监控到服务节点的响应状态异常时，向主节点发送重分配请求，以使主节点为客户端分配另一个服务节点。与现有技术中主节点轮询服务节点或者服务节点之间相互通信以确定异常的服务节点的方案相比，能有效缩短确定异常的服务节点及重分配所需花费的时间，进而降低对用户读写数据造成的影响。

下面对本发明的应用场景进行示例性说明：

参见图1，该应用场景包括：客户端、主节点、服务节点，其中：

客户端，与分布式存储系统建立连接，是服务请求(例如：读写请求等)的发送方，可以向分布式存储系统发送服务请求，并接收分布式存储系统返回的响应；

服务节点，是分布式存储系统的组成部分，一个分布式存储系统中通常包括多个服务节点(例如图1中示出了3个服务节点)，服务节点是服务请求的响应方，基于客户端发送的服务请求来向客户端提供相应的服务；

主节点，是分布式存储系统的组成部分，用于管理并调度分布式存储系统中的服务节点。

三者之间的交互过程可以为：

客户端向主节点发送分配请求，主节点响应于分配请求返回分配的服务节点的标识；客户端基于标识与该服务节点建立读写连接，进而向该服务节点发送读写请求，服务节点响应于读写请求为客户端提供数据读写服务。

以下结合附图，详细说明本申请各实施例提供的技术方案。

实施例1

图2为本说明书实施例1提供的客户端侧的一种服务异常处理方法的流程示意图，参见图2，该方法可由图1中的客户端执行，具体可以包括如下步骤：

步骤22、向所述第一服务节点发送服务请求，所述第一服务节点为主节点所分配；

不难理解的是，在步骤22之前还包括：分配服务节点的步骤，具体可以为：

步骤S1、向主节点发送第一分配请求；

步骤S2、接收所述主节点返回的第一分配信息，所述第一分配信息包括第一服务节点的标识；

其中，第一分配请求可以包括读写需求信息，例如：每秒进行读写操作的次数、比特率等参数；进而，主节点可基于读写需求信息选出的、相关参数符合读写需求信息要求的参数的服务节点，作为第一服务节点。

步骤24、监控所述第一服务节点对所述服务请求的响应状态；具体地，

若监控到所述第一服务节点的响应超时，则向所述第一服务节点重新发送所述服务请求；若监控到所述第一服务节点的连续响应超时次数达到预定阈值，则确定所述第一服务节点的响应状态异常。

其中，服务请求包括建立读写连接的请求、读写请求和心跳消息中的一种或多种。下面分别对每种服务请求情况进行详细说明：

第一种情况、服务请求为建立读写连接的请求

客户端首先确定主节点为客户端分配的第一服务节点的标识，包括：IP地址、服务节点编号等，后续以IP地址为例；然后，基于第一服务节点的IP地址向第一服务节点发送建立读写连接的请求。

相应地，在正常情况下，第一服务节点会响应于该请求建立与客户端的读写连接，以完成读写连接的建立；但在出现异常情况(例如：网络抖动、网络中断)时，第一服务节点可能未及时响应该请求，由此，客户端若监控到第一服务节点的响应超时，则向第一服务节点发送重建读写连接的请求，以请求第一服务节点建立读写连接；但是，若监控到连续重建响应超时的次数达到预定次数阈值(例如：5次)，则确定所述第一服务节点的响应状态异常。

其中，读写连接为客户端与第一服务节点建立的、用于进行数据读写的连接。

本情况可以实例为：客户端基于第一服务节点的IP地址，向第一服务节点发起第一次建立读写连接的请求，若第一服务节点能及时响应，则完成建立读写连接，进入后续数据读写步骤；若第一服务节点的响应超时，则客户端向第一服务节点发起第二次建立读写连接的请求，若第一服务节点能及时响应，则完成建立读写连接；若第一服务节点的响应超时，则客户端向第一服务节点发起第三次建立读写连接的请求…以此类推，当检测到连续多次(例如：5次)重建读写连接均超时，则确定第一服务节点的响应状态异常。

不难理解的是，当建立读写连接后，若由于网络中断、网络波动等异常情况导致读写连接断开，则客户端需要重新向第一服务节点发起重建读写连接的请求，并将重连接次数清零。

第二种情况、服务请求为读写请求，即读写连接建立后，客户端向第一服务节点发送的进行数据读写操作的请求

若监控到所述第一服务节点的响应超时，则向所述第一服务节点发送重读写请求；

若监控到连续重读写响应超时的次数达到预定阈值，则确定所述第一服务节点的响应状态异常。

本情况可以实例为：客户端基于第一服务节点的IP地址向第一服务节点发送读写请求，以进行相关数据的读写；当在预定时限内接收到第一服务节点完成数据读写的响应时，则确定完成本次的数据读写；当在时限内未接收到第一服务节点的响应，则确定第一服务节点的响应超时，并再次向第一服务节点发送读写请求…若第一服务节点连续多次响应超时，则确定第一服务节点可能因为网络、负载等因素的影响而响应状态异常。

第三种情况、服务请求为心跳消息，即读写连接建立后，客户端和服务节点之间进行发送的心跳消息，用于确定作为心跳消息发送方的状态，此处优选为客户端为心跳消息发送方；

若监控到心跳消息发送失败，则确定所述第一服务节点的响应状态异常。

本情况可以实例为：客户端基于读写连接与第一服务节点保持心跳连接，此处的心跳连接可以为客户端作为发送端，第一服务节点作为接收端，或者，客户端为接收端，第一服务节点作为发送端；为便于后续描述，此处优选为前者。相应地，若客户端心跳消息发送成功，则确定心跳连接正常、第一服务节点正常；若心跳消息发送失败，则确定第一服务节点的响应状态异常。或者，

若心跳消息发送失败，则进一步基于当前时间与最后一次发送成功的心跳消息携带的更新时间，确定心跳消息发送失败的持续时长；若确定持续时长达到预定时长阈值时，则确定第一服务节点的响应状态异常。

上述三种情况中，后两者一般是建立在第一种情况的基础上的，当然也可以不进行第一种情况，直接进行后两者；而且，后两者之间相互独立，可以择一使用，也可同时使用。此处优选为三种情况均进行，且执行顺序为先第一种情况，再并行进行后两者。

步骤26、当监控到所述第一服务节点的响应状态异常时，向所述主节点发送第二分配请求，所述第二分配请求包括所述第一服务节点的标识，以便所述主节点重分配所述第一服务节点以外的第二服务节点。

即，客户端在监控到上述三种情况中任一种响应状态超时时，均可向主节点发送第二分配信息，以使主节点在第一时间明确第一服务节点出现异常并为客户端重分配第二服务节点。进而，客户端可基于重新分配的第二服务节点进行数据读写，确保客户端的正常读写不会受到影响。

可选的，为降低网络抖动等异常情况对客户端的影响，本实施例还进一步引入异常节点集合的概念，其中包括响应状态异常的服务节点的标识。由此，可在分配或重分配服务节点时，优先考虑异常节点集合之外的服务节点。

可选的，上述步骤22-步骤26中的所述第一分配请求、第二分配请求可分别包括异常节点集合；相应地，所述第一服务节点、第二服务节点由所述主节点根据所述异常节点集合来确定，其中，所述第一服务节点不包含于所述第一分配请求的异常节点集合中，所述第二服务节点不包含于所述第二分配请求的异常节点集合中。具体地：

客户端将其最新的异常节点集合发送给主节点，由主节点响应于客户端的请求，基于客户端的读写需求信息从除异常节点集合之外的服务节点中为客户端分配第一服务节点；然后，当客户端监控到第一服务节点的响应状态异常时，将第一服务节点加入到所述异常节点集合，由主节点为客户端重新分配异常节点集合之外的第二服务节点，以供客户端继续进行正常的数据读写。由此，在为客户端分配和重分配服务节点时，都不会分配异常节点集合中的服务节点，从而实现进一步地降低网络抖动等异常情况对客户端的影响的目的。

可选的，本实施例还进一步地公开了维护异常节点集合的步骤，其第一种实现方式可以为，由客户端本地维护异常节点集合：

根据一种实施例，异常节点集合可以以黑名单的方式实现，即，客户端处存储有黑名单，黑名单中包括异常的服务节点的标识。在数据读写过程中，客户端监控主节点分配的服务节点的响应状态，每监控到响应状态异常的服务节点，则将其加入该异常节点集合中(即，将异常的服务节点的标识加入黑名单中)，并在发送重分配请求(例如：上述第二服务节点)时，将其最新的异常节点集合一并发送给主节点。

其第二种实现方式可以为，由主节点为客户端维护异常节点集合：

主节点基于各客户端的标识分别为各客户端创建一异常节点集合，各客户端所对应的异常节点集合可以以文件或列表等形式来存储，例如，每一个客户端对应于一个黑名单文件，黑名单文件中存储有对于该客户端响应异常的服务节点的标识；又例如，可以采用一个列表来存储多个客户端的异常节点集合，每个客户端对应于列表中的一条数据记录，数据记录的主键(key)为客户端的标识，值(value)为客户端的异常节点集合(即对该客户端响应异常的服务节点的标识)；等等。应当指出，本发明对各客户端的异常节点集合在主节点处的具体存储方式不做限制。主节点基于客户端发送重分配请求中携带的响应状态异常的服务节点的标识(例如：上述第二分配请求中的第一服务节点的标识)，将响应状态异常的服务节点的标识加入该客户端的异常节点集合中，并从异常节点集合之外的服务节点中选出一服务节点，重新分配给该客户端。

其第三种实现方式可以为，由客户端和主节点分别维护一份该客户端的异常节点集合，两份异常节点集合互为主备关系，以便当其中一方维护的异常节点集合丢失时，可基于对方的异常节点集合进行恢复。另外，由于前两种实现方式已对客户端和主节点分别维护一异常节点集合进行了描述，故，此处不再对其中的相似之处进行赘述。

可选的，由于服务节点的响应状态异常可能是由于负载、网络抖动等外界因素引起的，因此，当这些外界因素恢复正常时，服务节点的响应状态可能也会恢复正常。故，为提高正常服务节点的使用率，避免列入异常节点集合中的服务节点越来越多、可用服务节点越来越少的情况，本实施例还进一步公开了删减异常节点集合中的服务节点的步骤，适用于客户端和主节点，其第一种实现方式可以为：

确定各异常节点(即，异常状态的服务节点)加入到所述异常节点集合中的时长；将所述时长大于等于预定时长阈值的异常节点标识从所述异常节点集合中删除。即，在将异常节点加入异常节点集合的同时，还记录其录入时间，当检测到录入时长达到预定时长阈值的异常节点时，将该异常节点剔除出异常节点集合。

其第二种实现方式可以为：

向异常节点发送心跳消息；将心跳消息处理正常的异常节点从所述异常节点集合中删除。

即，基于异常节点集合中异常节点的标识，与各异常节点尝试建立心跳连接，以周期性地向各服务节点发送心跳消息，查看各异常节点的响应状态；若心跳消息发送失败，则确定异常节点依然处于响应状态异常，并继续尝试心跳连接；若心跳消息发送正常且达到一定时长，则确定异常节点的响应状态恢复正常，即可将恢复正常的服务节点剔除异常节点集合。

可见，本实施例通过在主节点为客户端分配服务节点后，由客户端监控该服务节点对客户端的服务请求的响应状态，在若监控到服务节点的响应状态异常时，向主节点发送重分配请求，以使主节点为客户端分配另一个服务节点。与现有技术中主节点轮询服务节点或者服务节点之间相互通信以确定异常的服务节点的方案相比，本方案由客户端来监控服务节点的响应状态并及时上报服务节点的异常信息，从而能够更有针对性地识别出相对于客户端异常的服务节点，有效缩短确定异常服务节点及为客户端重分配服务节点所需花费的时间，进而降低对用户读写数据造成的影响。

实施例2

图3为本说明书提供实施例2提供的主节点侧的一种服务异常处理方法的流程示意图，参见图3，可由图1中的主节点执行，具体可以包括如下步骤：

步骤32、接收客户端发送的第一分配请求；

步骤34、向所述客户端发送第一分配信息，所述第一分配信息包括第一服务节点的标识；

步骤36、接收所述客户端发送的第二分配请求，所述第二分配请求为所述客户端监控到所述第一服务节点的响应状态异常时发送，所述第二分配请求包括所述第一服务节点的标识；

步骤38、向所述客户端发送第二分配信息，所述第二分配信息包括第二服务节点的标识，其中，所述第二服务节点从所述第一服务节点以外的服务节点中确定。

不难理解的是，步骤32-步骤38分别与客户端侧的方法中的步骤22-步骤210相似，其实现方式也对应相似，故，此处不再进行赘述。

可选的，本实施例进一步地公开了验证第一服务节点是否确实响应异常的步骤，具体的：

主节点定时与第一服务节点进行通信，以尝试建立心跳连接，若检测到心跳消息发送失败，则确定第一服务节点确实异常。

实施例3

图4为本说明书提供的实施例3提供的主节点、服务节点和客户端的交互流程示意图，下面参见图4对分配和重分配过程进行详细说明：

步骤42、客户端获取读写需求信息；

其中，读写需求信息可以为用户输入的，也可以为客户端自动生成的，包括每秒进行读写操作的次数、比特率等读写参数和存储大小、所需存储介质等磁盘参数。

步骤44、客户端向主节点发送第一分配请求；

其中，第一分配请求包括读写需求信息；

步骤46、主节点基于读写需求信息为客户端分配合适的磁盘和第一服务节点；其中，磁盘可以示例为虚拟磁盘，即在本地虚拟出的一个分布式存储系统的磁盘。以分配虚拟磁盘为例，步骤46的实现方式可以为：

确定所述磁盘参数对应的虚拟磁盘，例如：从虚拟磁盘列表中选出与客户端需求的存储大小、所需存储介质等磁盘参数相符合的虚拟磁盘；或者，基于客户端需求的磁盘参数，虚拟出一参数相符的磁盘，作为磁盘参数对应的虚拟磁盘；然后，从异常节点集合之外的服务节点中选出读写该虚拟磁盘的参数满足读写参数的服务节点，进而基于选出的服务节点的历史读写参数和负载信息，对选出的服务节点进行评分，得到一最优服务节点，作为第一服务节点。

其中，确定最优服务节点的步骤的实现方式可以为：

主节点可先从服务节点列表中选出该客户端的异常节点集合之外服务节点，称为第一批服务节点；然后，将第一批服务节点中各服务节点读写该虚拟磁盘的读写参数与客户端要求的读写参数进行对比，进一步得到符合客户端需求的服务节点，称为第二批服务节点；然后，基于第二批服务节点中各服务节点的负载信息和历史读写参数，对第二批服务节点的读写能力进行评分，例如：可将服务节点历史上的最高读写参数、最低读写参数、平均读写参数作为评分标准之一，当前的负载信息作为评分标准之一进行评分，选出评分最高的服务节点，作为第一服务节点。

步骤48、主节点向客户端返回第一分配信息，第一分配信息包括第一服务节点的标识。

其中，标识可以为IP地址、MAC地址等等，此处优选为IP地址。

步骤410、客户端向第一服务节点发送读写连接建立请求；

即，基于第一分配信息中的第一服务节点的IP地址，向第一服务节点发送读写连接建立请求。

步骤412、第一服务节点向客户端发送读写连接建立成功的消息；

不难理解的是，第一服务节点在正常情况下会响应该请求，以完成读写连接的建立；但在网络抖动、网络中断、负载过大等异常情况下，第一服务节点可能出现响应超时的情况，对于此情况，则直接跳转至步骤418，以向主节点发送第二分配请求。

步骤414、客户端向第一服务节点发送读写请求；

即，客户端基于步骤412建立的读写连接向第一服务节点发送进行数据读写的读写请求。

步骤416、客户端监控第一服务节点的响应是否超时且超时次数达到预定阈值；

若是，则执行步骤418；若否，则进行数据读写。

步骤418、客户端向主节点发送第二分配请求；

其中，第二分配请求包括第一服务节点的标识。

步骤420、主节点为客户端分配第二服务节点；具体地：

结合图1对应的实施例中的异常节点集合相关描述，基于维护异常节点集合步骤的实现方式不同，步骤420的一种实现方式可以为：

当异常节点集合是由主节点维护时，主节点可基于所述客户端的标识，确定所述客户端的异常节点集合；基于所述客户端的读写需求信息，从异常节点集合和所述第一服务节点之外的服务节点中选出最优服务节点，作为第二服务节点。

即，主节点可以将建立一异常节点集合库，库中包括每个客户端对应的异常节点集合，异常节点集合中包括服务节点的标识，例如：IP地址、编号等等；当接收到某客户端发来的第二分配请求时，基于客户端的标识提取该客户端的异常节点集合，并将第二分配请求中携带的第一服务节点的标识存入，然后，从异常节点集合之外的服务节点中选出一合适的服务节点。

步骤420的另一种实现方式可以为：

当异常节点集合是由客户端维护时，客户端发送第二分配请求中携带其最新的异常节点集合，由此，主节点可从异常节点集合之外的服务节点在选出最优服务节点，作为第二服务节点；

步骤422、主节点向客户端返回第二分配信息；

其中，第二分配信息携带第二服务节点的标识。

可见，本实施例通过在主节点为客户端分配服务节点后，由客户端监控该服务节点对客户端的服务请求的响应状态，在若监控到服务节点的响应状态异常时，向主节点发送重分配请求，以使主节点为客户端分配另一个服务节点。与现有技术中主节点轮询服务节点或者服务节点之间相互通信以确定异常的服务节点的方案相比，能有效缩短确定异常的服务节点所需花费的时间，进而降低对用户读写数据造成的影响。

实施例4

图5为本说明书的实施例4提供的客户端侧的一种服务异常处理方法的流程示意图，参见图5，该方法具体可以包括如下步骤：

步骤52、向主节点发送第一分配请求，所述第一分配请求包括读写需求信息；

其中，读写需求信息包括每秒进行读写操作的次数、比特率等读写参数，还包括：存储大小等磁盘参数。

步骤54、接收所述主节点发送的第一分配信息，所述第一分配信息包括第一服务节点的标识和第一磁盘的标识；

其中，所述第一服务节点为所述主节点基于读写参数从所述异常节点集合之外的服务节点中选出的、用于为客户端提供第一磁盘的读写请求，所述第一磁盘由所述主节点基于磁盘参数为客户端分配的。

步骤56、向所述第一服务节点发送针对第一磁盘的服务请求；

其中，所述服务请求包括第一磁盘的标识；

步骤58、监控所述第一服务节点对所述服务请求的响应状态；

步骤510、当监控到针对所述第一磁盘的服务请求响应状态异常时，向所述主节点发送第二分配请求，所述第二分配请求包括所述第一磁盘的标识和所述第一服务节点的标识，以便所述主节点根据所述第二分配请求来重分配与第一磁盘不同的第二磁盘和/或与第一服务节点不同的第二服务节点。

本实施例中，主节点基于客户端的读写需求信息，可能会为客户端分配一个或多个第一磁盘，为方便后续描述，此处将第一磁盘的个数示例为2个，且均为虚拟磁盘，记为第一子虚拟磁盘和第二子虚拟磁盘，针对第一子虚拟磁盘和第二子虚拟磁盘的服务请求分别记为第一服务请求和第二服务请求。

基于此，当服务请求为读写请求时，步骤56-步骤510的第一种实现方式可以示例为：

客户端基于第一子虚拟磁盘和第二子虚拟磁盘的标识，向第一服务节点发送第一读写请求和第二读写请求。

在响应状态正常的情况下，第一服务节点会响应第一读写请求和第二读写请求提供第一子虚拟磁盘和第二子虚拟磁盘的数据读写服务，并反馈数据读写结果；在响应状态异常的情况下，例如：第一服务节点出现网络抖动或者负载过大，可能出现第一服务节点能响应第一读写请求，但无法响应第二读写请求的情况，导致第二读写请求的响应超时，进而客户端在监控到第一服务节点对第二读写请求的响应超时时，将向主节点发送第二分配信息，以供主节点明确出现读写异常是第二子虚拟磁盘还是第一服务节点并进行重分配。

其中，确定异常并重分配的情况包括如下至少一种：

情况1、主节点尝试与第一服务节点建立心跳连接，若心跳消息正常，则确定第一服务节点正常，第二子虚拟磁盘异常；基于此，主节点发送的第二分配信息中携带第三子虚拟磁盘的标识，以供客户端基于第三子虚拟磁盘进行数据读写。

可选的，主节点将第二子虚拟磁盘作为异常磁盘予以记录。

情况2、若心跳消息异常，则确定第一服务节点异常，第二子虚拟磁盘可能异常；基于此，主节点为客户端重分配一第二服务节点，以供客户端基于第二服务节点进行第二子虚拟磁盘的数据读写；或者，

主节点为客户端重分配一第二服务节点和第三子虚拟磁盘，以供客户端基于第二服务节点进行第三子虚拟磁盘的数据读写。由此，主节点不仅为客户端重新分配服务节点，还重新分配虚拟磁盘，以彻底解决服务异常的问题，确保用户数据读写不受影响。

当服务请求为心跳消息时，步骤56-步骤510的第二种实现方式可以示例为：

客户端基于第一子虚拟磁盘和第二子虚拟磁盘的标识，分别向第一服务节点发送第一心跳消息和第二心跳消息。

在响应状态正常的情况下，客户端发送的心跳消息会由第一服务节点接收，并选择性地由第一服务节点反馈客户端接收到第一心跳消息和第二心跳消息；但在响应状态异常的情况下，例如：第一服务节点出现网络抖动或者负载过大，可能第一服务节点接收到了第一心跳消息，但无法接收第二心跳消息，也就出现了存在子虚拟磁盘的心跳消息发送失败的情况。对于此情况，客户端将向主节点发送第二分配信息，以供主节点明确读写异常的是第二子虚拟磁盘还是第一服务节点并进行重分配。由于确定异常并重分配步骤与服务请求为读写请求时的情况相似，故，此处不再展开说明。

可选的，当用户的读写需求信息发生变化时，第二分配信息还包括最新的读写需求信息。相应地，主节点将基于最新的读写需求信息，从异常磁盘之外的范围为客户端重分配第二磁盘，并携带在第二分配信息中发送给客户端。

可见，本实施例中客户端针对不同虚拟磁盘分别发送磁盘粒度的服务请求，以在监控到第一服务节点对某虚拟磁盘的服务请求的响应状态超时时，向主节点发送第二分配信息，以报告服务异常的虚拟磁盘和第一服务节点，以使主节点重新为客户端分配虚拟磁盘和/或服务节点。由此，能缩短确定状态服务异常的虚拟磁盘所需花费的时间，及时分配新的虚拟磁盘或服务节点避免影响用户读写。

实施例5

图6为本说明书实施例5提供的服务节点侧的一种服务异常处理方法的流程示意图，参见图6，该方法具体可以包括如下步骤：

步骤62、接收主节点发送的分配信息，所述分配信息包括客户端的标识和第一磁盘的标识，用于指示所述服务节点(即为第一服务节点)为所述客户端提供所述第一磁盘对应的读写服务；

步骤64、监控所述客户端发送的针对所述第一磁盘的服务请求；

步骤66、当监控到所述服务请求发送超时时，关闭所述第一磁盘与所述客户端之间的读写连接，以便所述客户端在监控到所述服务节点对所述服务请求的响应状态超时时，请求所述主节点重分配其他磁盘(即为第二磁盘)和/或其他服务节点(记为第二服务节点)。

结合图1，对于步骤62-步骤66，主节点在为客户端分配第一磁盘和第一服务节点后，会同步将分配结果发送给客户端和该第一服务节点，以通知第一服务节点需要为客户端提供读写服务的磁盘，由此，服务节点监控客户端向第一磁盘发送的服务请求是否有超时。以服务请求为心跳消息为例：

服务节点接收客户端发送的心跳消息，识别心跳消息中包括的第一磁盘的标识，将该第一磁盘的标识与需要提供读写服务的磁盘的标识进行对比，以确定哪些磁盘的心跳消息已超时，哪些磁盘的心跳消息未超期，进而断开心跳超时的磁盘上该客户端对应的读写连接。

可见，本实施例通过将分配结果同步传输给服务节点，并由服务节点监控各磁盘上的服务请求是否超时，若是，则断开该磁盘上客户端的读写连接。以供客户端在检测到针对该磁盘的读写服务异常时，向主节点发起重分配请求，并由主节点重新为客户端分配服务节点和/或磁盘。基于此，能缩短确定状态服务异常服务节点和/或异常磁盘所需花费的时间，及时重分配其他服务节点和/或磁盘，避免影响用户读写。

实施例6

图7为本说明书实施例6提供的主节点侧的一种服务异常处理方法的示意图，参见图7，具体可以包括如下步骤：

步骤72、主节点接收客户端发送的第一分配请求；

其中，所述第一分配请求包括读写需求信息，读写需求信息包括每秒进行读写操作的次数、比特率等读写参数和存储大小、所需存储介质等磁盘参数；

可选的，第一分配请求还包括该客户端最新的异常节点集合。

步骤74向所述客户端发送第一分配信息，所述第一分配信息包括第一磁盘的标识和第一服务节点的标识；其中，第一磁盘可以示例为一虚拟磁盘。具体地：

步骤S1、确定所述磁盘参数对应的虚拟磁盘；

例如：从虚拟磁盘列表中选出与客户端需求的存储大小、所需存储介质等磁盘参数相符合的虚拟磁盘；或者，基于创建一客户端需求的磁盘参数，虚拟出一参数相符的磁盘，作为磁盘参数对应的虚拟磁盘。而且，主节点为客户端分配的虚拟磁盘的数量可能有1个或多个，为便于后续描述，此处将虚拟磁盘的个数示例为3个，并记为第一虚拟磁盘、第二虚拟磁盘和第三虚拟磁盘；

步骤S2、从异常节点集合之外的服务节点中选出读写所述虚拟磁盘的参数满足所述读写参数的服务节点；

步骤S3、基于服务节点的历史读写参数和负载信息，对所述选出的服务节点进行评分，得到最优服务节点，作为第一服务节点。

对于步骤S2和S3，不难理解的是，主节点可先从服务节点列表中选出服务节点异常节点集合之外的第一批服务节点；然后，分别将第一批服务节点的读写参数与客户端需求的读写参数进行对比，进一步得到符合客户端需求的第二批服务节点；然后，基于服务节点的负载信息和历史读写参数，对第二批服务节点的读写能力进行评分，例如：可将服务节点历史上的最高读写参数或最低读写参数或平均读写参数作为评分标准之一，当前的负载信息作为评分标准之一进行评分，以及在加上第一虚拟磁盘、第二虚拟磁盘和第三虚拟磁盘中的一个或两个的负载后，各服务节点的评分；然后，得到最佳分配方式。

其中，分配方式的第一种情况为：第一虚拟磁盘、第二虚拟磁盘和第三虚拟磁盘均由同一服务节点管控；第二种情况为：第一虚拟磁盘、第二虚拟磁盘和第三虚拟磁盘由两个或三个服务节点管控。

步骤76、接收所述客户端发送的第二分配请求，所述第二分配信息包括所述第一磁盘的标识和第一服务节点的标识，所述第二分配请求为所述客户端监控到所述第一服务节点的响应状态异常时发送的；

步骤78、向所述客户端发送第二分配信息，所述第二分配信息包括第二磁盘的标识，其中，所述第二磁盘与所述第一磁盘不同。

可选的，为避免为客户端分配到响应状态不稳定的服务节点，本实施例还进一步公开了针对单个服务节点进行读写连接的迁移步骤，结合图8，其具体可以包括如下步骤：

步骤82、基于第一服务节点的标识，确定所述第一服务节点的异常磁盘；

其中，异常磁盘的记录方式已在实施例4中的情况1中予以明确，故，此处不再赘述。

步骤84、确定第一服务节点上的异常磁盘占该服务节点的所有磁盘的比例；

步骤86、当所述比例大于预定阈值时，将所述第一服务节点上所有的磁盘读写请求迁移至其他服务节点。

对于步骤82-步骤86，假设第一服务节点管控的虚拟磁盘有10个，该10个虚拟磁盘可能用于供1个或多个客户端进行数据读写。主节点基于各客户端发来的报错信息(即第二分配信息)提取第一服务节点对应的报错信息。一方面为客户端重分配虚拟磁盘或为异常虚拟磁盘提供读写服务的服务节点；另一方面，统计分析10个虚拟磁盘中有多少个异常虚拟磁盘，当异常虚拟磁盘达到预定占比(例如：5个)时，则认为第一服务节点异常，并将其他5个非异常虚拟磁盘也进行重分配，以由其他正常的服务节点进行管控。

可见，本实施例通过客户端监控主节点分配的服务节点对其管控的虚拟磁盘的响应状态，以基于客户端发送的报错信息明确异常虚拟磁盘，进而重分配虚拟磁盘，以便客户端可通过重新分配的虚拟磁盘进行数据读写，能够有效缩短确定异常虚拟磁盘所花费的时间，以及降低受影响的读写连接范围。而且，在服务节点管控的虚拟磁盘出现大规模的异常虚拟磁盘时，对非异常虚拟磁盘也进行读写连接的迁移，预防对用户的数据读写造成影响。

实施例7

图9为本说明书实施例7提供的客户端侧的一种服务异常处理装置的结构示意图，参见图9，该装置具体可以包括：第一发送模块91、监控模块92和第二发送模块93，其中：

第一发送模块91，用于向所述第一服务节点发送服务请求，所述第一服务节点为主节点所分配；

监控模块92，用于监控所述第一服务节点对所述服务请求的响应状态；

第二发送模块93，用于当监控到所述第一服务节点的响应状态异常时，向所述主节点发送第二分配请求，所述第二分配请求包括所述第一服务节点的标识，以便所述主节点重分配所述第一服务节点以外的第二服务节点。

可选的，监控模块92，具体用于：

若监控到所述第一服务节点的响应超时，则向所述第一服务节点重新发送所述服务请求；

若监控到所述第一服务节点的连续响应超时次数达到预定阈值，则确定所述第一服务节点的响应状态异常。

其中，所述服务请求包括下述一种或多种：建立读写连接的请求、读写请求和心跳消息。

可选的，装置还包括：

第三发送模块，用于向主节点发送第一分配请求；

接收模块，用于接收所述主节点返回的第一分配信息，所述第一分配信息包括第一服务节点的标识。

可选的，所述第一分配请求、第二分配请求分别包括异常节点集合；

所述第一服务节点、第二服务节点由所述主节点根据所述异常节点集合来确定，其中，所述第一服务节点不包含于所述第一分配请求的异常节点集合，所述第二服务节点不包含于所述第二分配请求的异常节点集合。

可选的，所述装置还包括：

维护模块，用于当监控到所述第一服务节点的响应状态异常时，将所述第一服务节点加入所述异常节点集合。

可选的，维护模块，还用于：

确定各异常节点加入到所述异常节点集合中的时长；

将所述时长大于等于预定时长阈值的异常节点从所述异常节点集合中删除。

可选的，维护模块，还用于：

向异常节点发送心跳消息；

将心跳消息处理正常的异常节点从所述异常节点集合中删除。

可选的，所述第一分配请求、第二分配请求还分别包括读写需求信息，以便所述主节点根据第一分配请求中的读写需求信息来确定第一磁盘，以及根据第二分配请求中的读写需求信息来确定第二磁盘；

相应地，所述服务请求中包括第一磁盘的标识。

可选的，第二发送模块93，具体用于：

向所述第一服务节点发送针对所述第一磁盘的服务请求；

当监控到所述第一磁盘的服务请求响应状态异常时，所述第二分配请求还包括所述第一磁盘的标识，以便所述主节点将所述第一磁盘作为异常磁盘予以记录。

实施例8

图10为本说明书实施例8提供的主节点侧的一种服务异常处理装置的结构示意图，参见图10，该装置具体可以包括：第一接收模块101、第一发送模块102、第二接收模块103以及第二发送模块104，其中：

第一接收模块101，用于接收客户端发送的第一分配请求；

第一发送模块102，用于向所述客户端发送第一分配信息，所述第一分配信息包括第一服务节点的标识；

第二接收模块103，用于接收所述客户端发送的第二分配请求，所述第二分配请求为所述客户端监控到所述第一服务节点的响应状态异常时发送，所述第二分配请求包括所述第一服务节点的标识；

第二发送模块104，用于向所述客户端发送第二分配信息，所述第二分配信息包括第二服务节点的标识，其中，所述第二服务节点从所述第一服务节点以外的服务节点中确定。

可选的，所述第一分配请求、所述第二分配请求还分别包括异常节点集合；

所述第一服务节点、第二服务节点根据所述异常节点集合来确定，其中，所述第一服务节点不包含于所述第一分配请求的异常节点集合，所述第二服务节点不包含于所述第二分配请求的异常节点集合。

可选的，装置还包括：

维护模块，用于维护客户端所对应的异常节点集合；在所述接收所述客户端发送的第二分配请求的步骤之后，将所述第一服务节点加入所述客户端所对应的异常节点集合；根据所述异常节点集合来确定第二服务节点，其中，所述第二服务节点不包含于所述异常节点集合。

可选的，所述第一分配请求、第二分配请求还分别包括读写需求信息；

所述第一分配信息、第二分配信息还分别包括第一磁盘的标识、第二磁盘的标识，其中，所述第一磁盘根据第一分配请求中的读写需求信息来确定，所述第二磁盘根据第二分配请求中的读写需求信息来确定。

可选的，所述读写需求信息包括读写参数；

所述第一服务节点根据所述第一分配请求中的读写参数和各服务节点的负载信息来确定，所述第二服务节点根据第二分配请求中的读写参数和各服务节点的负载信息来确定。

可选的，所述第二分配请求还包括第一磁盘的标识，所述第二分配请求为客户端监控到所述第一磁盘的响应状态异常时发送，所述装置还包括：

记录模块，用于将所述第一磁盘作为异常磁盘予以记录。

可选的，所述装置还包括：

迁移模块，用于确定所述第一服务节点上的异常磁盘占该服务节点的所有磁盘的比例；当所述比例大于预定阈值时，将所述第一服务节点上所有的磁盘读写请求迁移至其他服务节点。

可见，本实施例通过在主节点为客户端分配服务节点后，由客户端监控该服务节点对客户端的服务请求的响应状态，在监控到服务节点的响应状态异常时，向主节点发送重分配请求，以使主节点为客户端分配另一个服务节点。与现有技术中主节点轮询服务节点或者服务节点之间相互通信以确定异常的服务节点的方案相比，能有效缩短确定异常的服务节点所需花费的时间，进而降低对用户读写数据造成的影响。

实施例9

图11为本说明书实施例9提供的客户端侧的一种服务异常处理装置的结构示意图，参见图11，该装置具体可以包括：第一发送模块111、第一接收模块112、第二发送模块113、监控模块114以及第三发送模块115，其中：

第一发送模块111，用于向主节点发送第一分配请求；

第一接收模块112，用于接收主节点发送的第一分配信息，所述第一分配信息包括第一磁盘的标识和第一服务节点的标识；

第二发送模块113，用于向所述第一服务节点发送针对所述第一磁盘的服务请求；

监控模块114，用于监控所述第一服务节点对所述服务请求的响应状态；

第三发送模块115，用于当监控到针对所述第一磁盘的服务请求响应状态异常时，向所述主节点发送第二分配请求，所述第二分配请求包括所述第一磁盘的标识和所述第一服务节点的标识，以便所述主节点根据所述第二分配请求来返回第二磁盘的标识，其中，所述第二磁盘与所述第一磁盘不同。

实施例10

图12为本说明书实施例10提供的服务节点侧的一种服务异常处理装置的结构示意图，参见图12，该装置具体可以包括：接收模块121、监控模块122和发送模块123，其中：

接收模块121，用于接收主节点发送的分配信息，所述分配信息包括客户端的标识和第一磁盘的标识，用于指示所述服务节点为所述客户端提供所述第一磁盘对应的读写服务；

监控模块122，用于监控所述客户端发送的针对所述第一磁盘的服务请求；

发送模块123，用于当监控到所述服务请求发送超时时，关闭所述第一磁盘与所述客户端之间的读写连接，以便所述客户端在监控到所述服务节点对所述服务请求的响应状态超时时，请求所述主节点重分配第二磁盘和/或其他服务节点，其中，第二磁盘和第一磁盘不同。

实施例11

图13为本说明书实施例11提供的主节点侧的一种服务异常处理装置的结构示意图，参见图13，该装置具体可以包括：第一接收模块131、第一发送模块132、第二接收模块133以及第二发送模块134，其中：

第一接收模块131，用于接收客户端发送的第一分配请求；

第一发送模块132，用于向所述客户端发送第一分配信息，所述第一分配信息包括第一磁盘的标识和第一服务节点的标识；

第二接收模块133，用于接收所述客户端发送的第二分配请求，所述第二分配信息包括所述第一磁盘的标识和第一服务节点的标识，所述第二分配请求为所述客户端监控到所述第一服务节点的响应状态异常时发送的；

第二发送模块134，用于向所述客户端发送第二分配信息，所述第二分配信息包括第二磁盘的标识，其中，所述第二磁盘与所述第一磁盘不同。

对于上述实施例9-11，其分别从客户端、服务节点和主节点三侧描述了服务异常处理方法，通过在主节点为客户端分配服务节点和第一磁盘后，由客户端监控该服务节点对客户端发送的针对第一磁盘的服务请求的响应状态，在若监控到服务节点的响应状态异常时，向主节点发送重分配请求，以使主节点为客户端分配第二磁盘。由此，能缩短确定状态服务异常的虚拟磁盘所需花费的时间，及时分配新的虚拟磁盘或服务节点避免影响用户读写。

另外，对于上述装置实施方式而言，由于其与方法实施方式基本相似，所以描述的比较简单，相关之处参见方法实施方式的部分说明即可。而且，应当注意的是，在本发明的装置的各个部件中，根据其要实现的功能而对其中的部件进行了逻辑划分，但是，本发明不受限于此，可以根据需要对各个部件进行重新划分或者组合。

实施例12

图14为本说明书一实施例提供的一种电子设备的结构示意图，参见图14，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成服务异常处理装置。当然，除了软件实现方式之外，本申请并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

网络接口、处理器和存储器可以通过总线系统相互连接。总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(PeripheralComponent Interconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图14中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据。存储器可能包含高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器。

处理器，用于执行所述存储器存放的程序，并根据存储器中存放的不同程序，作为客户端、主节点或服务节点来执行上述实施例1-8中任一项的方法。

上述如本申请图9-13所示实施例揭示的服务异常处理装置或管理者(Master)节点执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

服务异常处理装置还可执行图2-8的方法，并实现管理者节点执行的方法。

基于相同的发明创造，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行图2-8对应的实施例提供的服务异常处理方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种服务异常处理方法，包括：

监控所述第一服务节点对所述服务请求的响应状态；

2.根据权利要求1所述的方法，其中，所述监控所述第一服务节点对所述服务请求的响应状态包括：

3.根据权利要求1所述的方法，其中，所述服务请求包括下述一种或多种：建立读写连接的请求、读写请求和心跳消息。

4.根据权利要求1-3任一项所述的方法，其中，在所述向第一服务节点发送服务请求的步骤之前，还包括：

向主节点发送第一分配请求；

接收所述主节点返回的第一分配信息，所述第一分配信息包括第一服务节点的标识。

5.根据权利要求4所述的方法，其中，

所述第一分配请求、第二分配请求分别包括异常节点集合；

6.根据权利要求5所述的方法，其中，当监控到所述第一服务节点的响应状态异常时，所述方法还包括：

将所述第一服务节点加入所述异常节点集合。

7.根据权利要求5所述的方法，其中，还包括：

确定各异常节点加入到所述异常节点集合中的时长；

8.根据权利要求5所述的方法，其中，还包括：

向异常节点发送心跳消息；

9.根据权利要求4所述的方法，其中，所述第一分配请求、第二分配请求还分别包括读写需求信息，以便所述主节点根据第一分配请求中的读写需求信息来确定第一磁盘，以及根据第二分配请求中的读写需求信息来确定第二磁盘；

相应地，所述服务请求中包括第一磁盘的标识。

10.根据权利要求9所述的方法，其中，所述向所述第一服务节点发送服务请求的步骤包括：向所述第一服务节点发送针对所述第一磁盘的服务请求；

11.一种服务异常处理方法，包括：

接收客户端发送的第一分配请求；

接收所述客户端发送的第二分配请求，所述第二分配请求为所述客户端监控到所述第一服务节点的响应状态异常时发送，所述第二分配请求包括所述第一服务节点的标识；

12.根据权利要求11所述的方法，其中，所述第一分配请求、所述第二分配请求还分别包括异常节点集合；

13.根据权利要求11所述的方法，其中，还包括：维护客户端所对应的异常节点集合；

在所述接收所述客户端发送的第二分配请求的步骤之后，还包括：

将所述第一服务节点加入所述客户端所对应的异常节点集合；

根据所述异常节点集合来确定第二服务节点，其中，所述第二服务节点不包含于所述异常节点集合。

14.根据权利要求11所述的方法，其中，所述第一分配请求、第二分配请求还分别包括读写需求信息；

15.根据权利要求14所述的方法，其中，所述读写需求信息包括读写参数；

16.根据权利要求14或15所述的方法，其中，所述第二分配请求还包括第一磁盘的标识，所述第二分配请求为客户端监控到所述第一磁盘的响应状态异常时发送，所述方法还包括：

将所述第一磁盘作为异常磁盘予以记录。

17.根据权利要求16所述的方法，其中，所述方法还包括：

确定所述第一服务节点上的异常磁盘占该服务节点的所有磁盘的比例；

当所述比例大于预定阈值时，将所述第一服务节点上所有的磁盘读写请求迁移至其他服务节点。

18.一种服务异常处理方法，包括：

向主节点发送第一分配请求；

向所述第一服务节点发送针对所述第一磁盘的服务请求；

监控所述第一服务节点对所述服务请求的响应状态；

19.一种服务异常处理方法，包括：

接收客户端发送的第一分配请求；

20.一种服务异常处理装置，包括：

21.一种服务异常处理装置，包括：

第一接收模块，用于接收客户端发送的第一分配请求；

22.一种服务异常处理装置，包括：

第一发送模块，用于向主节点发送第一分配请求；

23.一种服务异常处理装置，其中，包括：

第一接收模块，用于接收客户端发送的第一分配请求；

24.一种电子设备，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行如权利要求1-10、18中任一项所述的方法。

25.一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行如权利要求1-10、18中任一项所述的方法。

26.一种电子设备，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行如权利要求11-17、19中任一项所述的方法。

27.一种计算机可读存储介质，其中，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行如权利要求11-17、19中任一项所述的方法。