WO2017097130A1

WO2017097130A1 - 一种分布式存储系统的服务节点切换方法和装置

Info

Publication number: WO2017097130A1
Application number: PCT/CN2016/107422
Authority: WO
Inventors: 姚文辉; 刘俊峰; 黄硕; 张海勇; 朱家稷
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2015-12-08
Filing date: 2016-12-08
Publication date: 2017-06-15
Also published as: US20180331888A1; US10862740B2; CN106856489B; CN106856489A

Abstract

本申请实施例提供了一种分布式存储系统的服务节点切换方法和装置，服务节点包括当前服务节点和备用服务节点，所述方法包括：监控所述服务节点对服务请求的响应状态；若所述当前服务节点的响应状态异常，则停止所述当前服务节点与备用服务节点之间的通讯，并触发当前服务节点的切换处理。通过服务节点检查逻辑，针对影响服务节点响应状态的多方面因素进行逻辑判断和数据统计，在遇到硬件故障或软件缺陷带来的服务超时、服务不可用、服务异常等的情况时，实现服务节点的自主切换和恢复，增强了服务可用性。

Description

一种分布式存储系统的服务节点切换方法和装置

本申请要求2015年12月08日递交的申请号为201510897877.X、发明名称为“一种分布式存储系统的服务节点切换方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及互联网技术领域，特别是涉及一种分布式存储系统的服务节点切换方法和一种分布式存储系统的服务节点切换装置。

背景技术

在当前大规模分布式存储系统中，为了实现集中权限认证和配额控制，主要采用集中式元数据管理的方法，即将整个系统中所有数据的元数据集中在若干个元数据服务节点进行存储。

这样的架构中元数据服务节点的可用性直接关系到整个系统的可用性，因此在分布式存储系统中通常通过冗余的方式提升元数据服务节点的可用性。目前提升元数据服务节点可用性的主要有两种方法，例如由元数据服务(Name Node)通过HA的方式(High Availablity，高可用性)，利用备用服务节点(Slave节点)切换掉异常状态的当前服务节点(Primary节点)；或者在例如阿里云飞天分布式系统和盘古文件存储系统使用Paxos协议实现服务节点的切换。

上述两种服务节点切换方法中，仅仅在由于服务器宕机、服务进程重启、网络断开等情况而导致的当前服务节点无法正常向备用服务节点发送心跳确认的情况下，才会触发服务节点的切换处理，在其他的例如双工网络单路断开、部分网络协议异常、磁盘响应慢等的异常情况下，由于锁维护机制和心跳机制，备用服务节点还是会认为当前服务节点处于正常的工作状态，而不会触发服务节点的切换处理。

然而，实际上处于异常状态的当前服务节点会导致响应用户的服务请求超时，无法提供完整的元数据，无法将日志存储在共享存储设备上等的问题，实际上已经影响到当前服务节点向用户提供的服务质量，但目前的服务节点切换方法无法相应地恢复正常和稳定的元数据服务。因此，目前的服务节点切换方法存在元数据服务恢复效率较低，影响了用户体验的问题。

发明内容

鉴于上述问题，提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种分布式存储系统的服务节点切换方法和相应的一种分布式存储系统的服务节点切换装置。

为了解决上述问题，本申请公开了一种分布式存储系统的服务节点切换方法，所述服务节点包括当前服务节点和备用服务节点，所述方法包括：

监控所述服务节点对服务请求的响应状态；

若所述当前服务节点的响应状态异常，则停止所述当前服务节点与备用服务节点之间的通讯，并触发当前服务节点的切换处理。

可选地，所述方法还包括：

若某个服务节点的响应状态异常，则对所述服务节点添加用于标记不参与当前服务节点的切换处理的异常节点标识。

可选地，所述触发当前服务节点的切换处理的步骤包括：

触发选取至少一个没有携带所述异常节点标识的服务节点作为新的当前服务节点，替换响应状态异常的当前服务节点。

可选地，所述监控所述服务节点对服务请求的响应状态的步骤包括：

通过多线程监控所述服务节点对服务请求的响应状态。

可选地，所述通过多线程监控所述服务节点对服务请求的响应状态的步骤包括：

通过第一检查线程获取所述服务节点从服务请求队列中最近取出服务请求的时间点T1，并将与当前时间点N1的时间间隔D1作为响应时间；

判断所述响应时间是否大于第一预设响应时间阈值，若是，则确定所述服务节点的响应状态异常。

通过第二检查线程判断所述服务节点的存储单元是否携带存储响应超时标识；

若是，则将所述存储响应超时标识对应的标识添加时间点T2与当前时间点N2的时间间隔D2作为所述响应时间，若所述响应时间大于第二预设响应时间阈值，则确定所述服务节点的响应状态异常。

可选地，在所述通过多线程监控所述服务节点对服务请求的响应状态的步骤之前，所述方法还包括：

通过日志记录线程获取所述服务节点的存储单元写日志的起止时间，并将所述起止时间的时间间隔作为存储单元响应时间；

判断所述存储单元响应时间是否大于第三预设响应时间阈值，若是，则针对所述存储单元添加所述存储响应超时标识，并相应记录添加标识的时间点T2。

可选地，所述方法还包括：

若所述存储单元响应时间小于所述第三预设响应时间阈值、且所述存储单元已经携带有所述存储响应超时标识，则删除所述存储响应超时标识。

可选地，在所述监控所述服务节点对服务请求的响应状态的步骤之前，所述方法还包括：

将对至少一个所述服务节点的监控结果注册到监控结果注册列表；

所述监控所述服务节点对服务请求的响应状态的步骤为：

在所述监控结果注册列表的起始位置轮询注册的监控结果。

可选地，所述方法还包括：

将所述多线程的个数除以所述预设响应时间阈值的结果作为监控所述服务节点响应状态的频率。

为了解决上述问题，本申请还公开了一种分布式存储系统的服务节点切换装置，所述服务节点包括当前服务节点和备用服务节点，所述装置包括：

服务节点响应状态监控模块，用于监控所述服务节点对服务请求的响应状态；

当前服务节点切换触发模块，用于若所述当前服务节点的响应状态异常，则停止所述当前服务节点与备用服务节点之间的通讯，并触发当前服务节点的切换处理。

可选地，所述装置还包括：

异常节点标识添加模块，用于若某个服务节点的响应状态异常，则对所述服务节点添加用于标记不参与当前服务节点的切换处理的异常节点标识。

可选地，所述当前服务节点切换触发模块包括：

触发选取子模块，用于触发选取至少一个没有携带所述异常节点标识的服务节点作为新的当前服务节点，替换响应状态异常的当前服务节点。

可选地，所述服务节点响应状态监控模块包括：

多线程监控子模块，用于通过多线程监控所述服务节点对服务请求的响应状态。

可选地，所述多线程监控子模块包括：

第一检查线程子单元，用于通过第一检查线程获取所述服务节点从服务请求队列中最近取出服务请求的时间点T1，并将与当前时间点N1的时间间隔D1作为响应时间；

第一预设响应时间阈值判断子单元，用于判断所述响应时间是否大于第一预设响应时间阈值，若是，则确定所述服务节点的响应状态异常。

可选地，所述多线程监控子模块包括：

第二检查线程子单元，用于通过第二检查线程判断所述服务节点的存储单元是否携带存储响应超时标识；若是，则调用第二预设响应时间阈值判断子单元；

第二预设响应时间阈值判断子单元，用于将所述存储响应超时标识对应的标识添加时间点T2与当前时间点N2的时间间隔D2作为所述响应时间，若所述响应时间大于第二预设响应时间阈值，则确定所述服务节点的响应状态异常。

可选地，所述装置还包括：

存储单元响应时间确定模块，用于通过日志记录线程获取所述服务节点的存储单元写日志的起止时间，并将所述起止时间的时间间隔作为存储单元响应时间；

存储响应超时标识添加模块，用于判断所述存储单元响应时间是否大于第三预设响应时间阈值，若是，则针对所述存储单元添加所述存储响应超时标识，并相应记录添加标识的时间点T2。

可选地，所述装置还包括：

存储响应超时标识删除模块，用于若所述存储单元响应时间小于所述第三预设响应时间阈值、且所述存储单元已经携带有所述存储响应超时标识，则删除所述存储响应超时标识。

可选地，所述装置还包括：

监控结果注册模块，用于将对至少一个所述服务节点的监控结果注册到监控结果注册列表；

所述服务节点响应状态监控模块包括：

监控结果轮询子模块，用于在所述监控结果注册列表的起始位置轮询注册的监控结果。

可选地，所述装置还包括：

监控频率确定模块，用于将所述多线程的个数除以所述预设响应时间阈值的结果作为监控所述服务节点响应状态的频率。

本申请实施例包括以下优点：

本申请实施例通过监控服务节点对服务请求的响应状态，并针对响应状态异常的当前服务节点执行停止其与备用服务节点之间的通讯，由此触发当前服务节点的切换处理。通过服务节点检查逻辑，针对影响服务节点响应状态的多方面因素进行逻辑判断和数据统计，在遇到硬件故障或软件缺陷带来的服务超时、服务不可用、服务异常等的情况时，实现服务节点的自主切换和恢复，增强了服务可用性，提升了服务恢复效率，改善了用户体验。

其次，本申请实施例可以针对影响服务节点响应状态的一个或多个方面的因素进行监控，多维度的监控手段提升了服务恢复的全面性和可扩展性。

进一步，本申请实施例对于异常的当前服务节点不将其直接初始化，而是采用相对保守的停止与备用服务节点通讯的方式来触发服务节点切换，当出现误诊事故时，被误诊为响应状态异常的当前服务节点也有机会重新作为新的当前服务节点，继续提供服务，避免了误诊对整个系统带来负面的影响。

进一步，本申请实施例对响应状态异常的服务节点添加异常节点标识，避免了将响应状态异常的服务节点被选作当前服务节点、从而无法实现服务节点切换目的的问题。而且，将异常的服务节点排除，服务节点的切换处理可以保证新的当前服务节点的稳定性，避免了多次服务节点切换引起的系统波动，提升了服务恢复的稳定性。

附图说明

图1是本申请的一种分布式存储系统的服务节点切换方法实施例一的步骤流程图；

图2是本申请的一种分布式存储系统的服务节点切换方法实施例二的步骤流程图；

图3是本申请的一种分布式存储系统的服务节点切换方法实施例三的步骤流程图；

图4是本申请的一种分布式存储系统的服务节点切换方法实施例四的步骤流程图；

图5是本申请的一种分布式存储系统的服务节点切换装置实施例一的结构框图；

图6是本申请的一种分布式存储系统的服务节点切换装置实施例二的结构框图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。

目前较常用的提升元数据服务节点可用性的方式中，可以在例如Hadoop分布式文件系统中，元数据服务利用备用服务节点切换掉异常状态的当前服务节点。具体为：通过分布式锁服务，由获取到分布式锁的服务节点作为当前服务节点，由当前服务节点对外提供，并将产生的日志存储在共享存储设备上，其他的备用服务节点不对外提供元数据服务，仅从共享存储设备上读取日志应用到内存，保持内存与当前服务节点同步一致。备用服务节点不定时检测锁的状态，当锁被释放时，即表明当前服务节点处于服务器宕机、服务进程重启、网络断开等异常状态，备用服务节点则获取分布式锁升级为新的当前服务节点并对外提供元数据服务。

另外一种较常用的提升可用性方式中，多个备用服务节点通过Paxos协议进行当前服务节点选举，从中产生一个对外提供元数据服务的当前服务节点，用户向当前服务节点请求元数据服务，当前服务节点响应后产生日志存储到本地，并发送给所有备用服务节点。备用服务节点收到日志后存储到本地并应用到内存，保持与当前服务节点同步一致。同时，在当前服务节点正常工作时，其可以向备用服务节点发送心跳确认信息，备用服务节点通过心跳机制确认当前服务节点的存活。若当前服务节点出现如服务器宕机、服务进程重启、网络断开等异常情况时，当前服务节点无法向备用服务节点发送心跳确认信息，备用服务节点由此发起当前服务节点切换处理，从备用服务节点中选举出新的当前服务节点对外提供元数据服务。

从上述可见，目前的提高元数据服务节点可用性的方法中，触发服务节点的切换依赖于导致当前服务节点完全无法工作的严重故障，其他一些引起当前服务节点响应慢等异常状态的故障则不会触发服务节点的切换，然而处于异常状态的当前服务节点已经影响到了向用户提供服务的质量。

因此，目前的服务节点切换方法存在元数据服务恢复效率较低，影响了用户体验的问题。而且，根据目前的服务节点切换方法，即使触发了服务节点切换处理，也有可能再次切换到已经处于异常状态的服务节点上，无法实现服务节点切换的目的，影响了元数据服务恢复的效率。为了解决上述问题，以下提出了若干个服务节点切换方法的实施例。

参照图1，示出了本申请的一种分布式存储系统的服务节点切换方法实施例一的步骤流程图，所述服务节点包括当前服务节点和备用服务节点，所述方法具体可以包括如下步骤：

步骤101，监控服务节点对服务请求的响应状态。

需要说明的是，服务节点可以为提供元数据服务的服务节点。元数据(Metadata)又称中介数据、中继数据，为描述数据的数据(data about data)，主要是描述数据属性(property)的信息，用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。

在具体的实现中，可以针对不同方面的检查点，在系统中相应地设置若干个检查线程以监控服务节点的响应状态是否异常。例如，设置一个关注于服务请求队列响应时间异常的第一检查线程和/或设置一个关注于存储单元响应时间异常的第二检查线程。

需要说明的是，响应时间是否异常可以通过与预设的响应时间阈值进行比较而确定，例如，可以预设响应时间阈值为10秒，如果服务节点对服务请求队列中的某各服务请求的响应时间超过10秒，或者服务节点的存储单元进行日志读写的响应时间超过10秒，可以理解为该服务节点的响应状态异常，其对服务请求的响应需要用户长时间等待，甚至无法正常服务，已影响到了用户体验。

作为本申请实施例的优选示例，可以通过多线程监控所述服务节点对服务请求的响应状态。因为在实际应用中，服务节点的响应状态可能会被多方面的因素所影响，本领域技术人员可以根据实际情况组合设置多个检查线程以监控服务节点对服务请求的响应状态，例如，还可以设置关注于存储单元是否接近满载的检查线程。

优选地，用于监控服务节点的检查线程可以不具备执行逻辑的能力，而仅仅用作检查响应状态的逻辑判断和数据统计。检查线程尽量保持轻量，避免进行运算量较大和耗时较长的处理工作，例如可以不进行RPC(Remote Procedure Call Protocol,远程过程调用协议)操作或者长时间的等锁操作，该操作有可能导致后续的服务节点切换处理被严重延迟、甚至无法有效执行，最终可能导致整个检查机制失去应有的效果。

步骤102，若所述当前服务节点的响应状态异常，则停止所述当前服务节点与备用服务节点之间的通讯，并触发当前服务节点的切换处理。

在具体的实现中，通过对服务节点的响应状态的监控，可以确定当前服务节点和备用服务节点的响应状态是否异常。针对于不同的服务节点的不同监控结果，可以执行相应的操作。针对于响应状态异常的当前服务节点，可以停止其与多个备用服务节点之间的通讯。

停止相互通讯的方式可以有多种，例如通过停止当前服务节点与备用服务节点之间的心跳确认的方式，当备用服务节点超过一定时间没有接收到当前服务节点发送的心跳确认信息，则可以认为当前服务节点处于异常状态并失效，需要发起当前服务节点的切换处理。

备用服务节点无法与当前服务节点正常通讯，可以认为当前服务节点处于异常状态，由此触发新的当前服务节点选举操作，并将新选举出的当前服务节点替换异常的当前服务节点，以完成当前服务节点的切换处理。当前服务节点的选举操作可以通过Paxos 协议实现。

实际应用中，还可以采用其他方式触发当前服务节点的切换处理，例如利用分布式锁服务，若备用服务节点认为该当前服务节点处于异常状态并失效，则触发该当前服务节点释放锁，多个备用服务节点进行抢锁操作，由获取到锁的备用服务节点替换异常的当前服务节点，以完成当前服务节点的切换处理。

针对于响应状态异常的当前服务节点和备用服务节点，还可以添加一个异常节点标识，携带有该标识的服务节点，则在服务节点的切换处理中不会被切换为新的当前服务节点，以免将异常的服务节点作为新的当前服务节点，达不到服务恢复的效果。

作为本申请实施例的优选示例，可以将对至少一个所述服务节点的监控结果注册到监控结果注册列表；在所述监控结果注册列表的起始位置轮询注册的监控结果。

实际应用中，可以设置检查点执行模块，以针对不同的监控结果执行相应的操作。各检查线程可以在系统启动过程中生成监控结果，并将监控结果注册到检查点执行模块的监控结果注册列表中。该检查点执行模块可以是系统后台线程，其可以在注册列表的起始位置开始按序逐一轮询监控结果，并根据监控结果执行相应的处理。例如，在某个监控结果中，第一检查线程根据服务请求处理响应时间判断出当前服务节点的响应状态异常，检查点执行模块由此可以停止其向备用服务节点发送心跳确认信息，并添加一个异常节点标识；又例如，在另外一个监控结果中，第二检查线程根据存储单元读写日志超时判断出备用服务节点的响应状态异常，检查点执行模块由此针对该备用服务节点添加异常节点标识。

需要说明的是，检查点执行模块可以不需要关注各个检查线程的逻辑判断如何实现，即不需要关注该检查线程具体如何监控该服务节点是否异常，仅仅关注监控结果所反映出的服务节点响应状态是否异常即可。具体地，服务节点的响应状态是否异常，可以由True和False表示，检查线程可以仅将True或False的值作为监控结果注册到检查点执行模块的注册列表中。

此外，还可以将所述多线程的个数除以所述预设响应时间阈值的结果作为监控所述服务节点响应状态的频率。

因为在实际应用中，如果监控的频率过低，则可能会遗漏了反映异常服务节点的监控结果，无法保证在当前服务节点出现异常时及时进行切换。因此，为了提高检查精度，监控的执行间隔不能大于任何一个检查线程用于判断响应状态是否异常而设置的预设响应时间阈值。例如，若预设的响应时间阈值为10秒，则监控的执行间隔可以设为1 秒。为了便于确定监控频率，可以根据进行监控的检查线程个数除以预设响应时间阈值，将结果作为监控频率。例如检查线程为10个，而预设响应时间阈值为10秒，则监控频率为1个每秒，即检查点执行模块可以每隔1秒就从监控结果注册列表调取一个监控结果，以执行相应处理。

本领域技术人员可以根据实际情况将本申请实施例所提供的方法应用于各种分布式文件系统和计算、存储平台，例如，HDFS系统(Hadoop Distributed File System)，ODPS计算平台(Open Data Processing Service,开放数据处理服务)，OSS存储平台(Object Storage Service,开放对象存储服务)，OTS存储平台(Open Table Service，开放表服务结构化数据服务)，ECS计算平台(Elastic Compute Service，弹性计算服务)等等。

相比起目前的服务节点切换方法，本申请实施例通过监控服务节点对服务请求的响应状态，并针对响应状态异常的当前服务节点执行停止其与备用服务节点之间的通讯，由此触发当前服务节点的切换处理。通过服务节点检查逻辑，针对影响服务节点响应状态的多方面因素进行逻辑判断和数据统计，在遇到硬件故障或软件缺陷带来的服务超时、服务不可用、服务异常等的情况时，实现服务节点的自主切换和恢复，增强了服务可用性，提升了服务恢复效率，改善了用户体验。

参照图2，示出了本申请的一种分布式存储系统的服务节点切换方法实施例二的步骤流程图，所述服务节点包括当前服务节点和备用服务节点，所述方法具体可以包括如下步骤：

步骤201，通过第一检查线程获取所述服务节点从服务请求队列中最近取出服务请求的时间点T1，并将与当前时间点N1的时间间隔D1作为响应时间。

需要说明的是，上述的第一检查线程可以是关注于服务请求队列响应时间是否异常的检查线程。当用户向当前服务节点提交服务请求，会先将服务请求放入服务请求队列中排队，等待被当前服务节点逐一处理。当前服务节点从队列中取出服务请求时，可以记录此时的时间点T1。

第一检查线程可以定期对服务请求队列进行检查，当服务请求队列存在等待处理的服务请求时，第一检查线程获取之前记录的最近取出服务请求的时间点T1，将当前时间点N1与T1的时间间隔D1作为该当前服务节点的响应时间。

步骤202，判断所述响应时间是否大于第一预设响应时间阈值，若是，则确定所述服务节点的响应状态异常。

可以将响应时间与第一预设响应时间阈值进行比较，若响应时间大于第一预设响应时间阈值，则表明该当前服务节点在处理用户的服务请求时被阻塞，造成用户长时间等待服务的情况。因此，无论该当前服务节点的其他方面是否正常，也可以认为该当前服务节点的响应状态异常。

实际应用中可以将第一预设响应时间阈值设置为10秒，也即是说，如果10秒之内也没有成功响应用户提交的服务请求，可以理解为当前服务节点的响应状态异常，当然，本领域技术人员可以根据实际情况设置第一预设响应时间阈值，本申请实施例对此不作限制。

第一检查线程可以将响应状态异常或正常的监控结果注册到检查点执行模块的监控结果注册列表中，由检查点执行模块根据监控结果采取相应的处理。

步骤203，若所述当前服务节点的响应状态异常，则停止所述当前服务节点与备用服务节点之间的通讯，并触发当前服务节点的切换处理。

步骤204，若某个服务节点的响应状态异常，则对所述服务节点添加用于标记不参与当前服务节点的切换处理的异常节点标识。

检查点执行模块针对于响应状态异常的当前服务节点，可以停止其与多个备用服务节点之间的通讯。针对于响应状态异常的当前服务节点和备用服务节点，还可以添加一个异常节点标识，携带有该标识的服务节点，则在服务节点的切换处理中不会被切换为新的当前服务节点。

作为本申请实施例的优选示例，所述触发当前服务节点的切换处理的步骤可以包括：触发选取至少一个没有携带所述异常节点标识的服务节点作为新的当前服务节点，替换响应状态异常的当前服务节点。

实际应用中，如果是通过Paxos协议选举当前服务节点，携带异常节点标识的服务节点不会参与到选举中。当备用服务节点触发当前服务节点的切换处理时，携带异常节点标识的服务节点不参与选举，则不会被选作新的当前服务节点。如果是通过分布式锁服务切换服务节点，携带异常节点标识的服务节点不会进行抢锁操作，仅仅由正常的服务节点参与抢锁。

本申请实施例对响应状态异常的服务节点添加异常节点标识，避免了将响应状态异常的服务节点被选作当前服务节点、从而无法实现服务节点切换目的的问题。而且，将异常的服务节点排除，服务节点的切换处理可以保证新的当前服务节点的稳定性，避免了多次服务节点切换引起的系统波动，提升了服务恢复的稳定性。

参照图3，示出了本申请的一种分布式存储系统的服务节点切换方法实施例三的步骤流程图，所述服务节点包括当前服务节点和备用服务节点，所述方法具体可以包括如下步骤：

步骤301，通过日志记录线程获取所述服务节点的存储单元写日志的起止时间，并将所述起止时间的时间间隔作为存储单元响应时间。

需要说明的是，用户提交服务请求时会产生日志，当前服务节点和备用服务节点均需要通过日志记录线程将日志记录到存储单元中，然后返回用户的服务请求处理成功的通知，因此存储单元的响应时间直接影响到对服务请求的响应时间。

在具体的实现中，日志记录线程记录有服务节点开始写日志的起止时间点和写日志完毕后的结束时间点，将起始时间点的时间间隔作为存储单元响应时间。

步骤302，判断所述存储单元响应时间是否大于第三预设响应时间阈值，若是，则针对所述存储单元添加所述存储响应超时标识，并相应记录添加标识的时间点T2。

判断存储单元响应时间是否大于第三预设响应时间阈值，若是，表明服务节点的存储单元存在异常，则可以针对存储单元添加存储响应超时标识，并记录添加该标识时的时间点T2。如果该服务节点的存储单元已经携带有存储响应超时标识，则可以不需要作标识添加处理。

步骤303，若所述存储单元响应时间小于所述第三预设响应时间阈值、且所述存储单元已经携带有所述存储响应超时标识，则删除所述存储响应超时标识。

在实际应用中，检查线程需要关注的是存储单元响应连续响应慢的异常情况，对于单独一次的存储单元响应慢，可能是偶然因素造成，可以暂时忽略，以免造成误测。因此，若存储单元响应时间小于第三预设响应时间阈值，且已经携带有存储响应超时标识，可以删除该标识。

步骤304，通过第二检查线程判断所述服务节点的存储单元是否携带存储响应超时标识。

步骤305，若是，则将所述存储响应超时标识对应的标识添加时间点T2与当前时间点N2的时间间隔D2作为所述响应时间，若所述响应时间大于第二预设响应时间阈值，则确定所述服务节点的响应状态异常。

第二检查线程可以判断存储单元是否携带存储响应超时标识，并根据判断结果进行相应处理。

若携带存储响应超时标识，则从日志记录线程中获取该标识的添加时间点T2，与当前的时间点N2相减得到两者的时间间隔D2作为服务节点的响应时间。若该响应时间大于第二预设响应时间阈值，则表明该服务节点将日志记录到存储单元的耗时过长，影响到对服务请求的响应时间。因此，无论该当前服务节点的其他方面是否正常，也可以认为该当前服务节点的响应状态异常。

第二检查线程将响应状态异常或正常的监控结果注册到检查点执行模块的监控结果注册列表中，由检查点执行模块根据监控结果采取相应的处理。例如，第二检查线程检查出在30秒内存储单元的响应时间没有降低到30毫秒以下，则可以判断该服务节点的存储单元出现异常，导致服务节点的响应状态异常。

步骤306，若所述当前服务节点的响应状态异常，则停止所述当前服务节点与备用服务节点之间的通讯，并触发当前服务节点的切换处理。

步骤307，若某个服务节点的响应状态异常，则对所述服务节点添加用于标记不参与当前服务节点的切换处理的异常节点标识。

需要说明的是，步骤301至步骤303可以循环进行，反复统计和比较存储单元写日志的响应时间，针对性地判断出是否存在存储单元连续响应慢的异常情况，并相应地更新存储单元的存储响应超时标识，以便于第二检查线程根据标识进行相应处理。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请实施例并不受所描述的动作顺序的限制，因为依据本申请实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本申请实施例所必须的。

参照图4，示出了本申请的一种分布式存储系统的服务节点切换方法实施例四的步骤流程图，所述服务节点包括当前服务节点和备用服务节点，所述方法具体可以包括如下步骤：

步骤401，通过多线程监控所述服务节点对服务请求的响应状态。

可以通过多个关注于服务节点不同方面问题的检查线程，监控所述服务节点对服务请求的响应状态是否异常。因为在实际应用中，服务节点的响应状态可能会被多方面的因素所影响，无论是单方面的因素还是多个因素综合作用，当影响到服务节点的响应状态，均可以针对性地监控，因此，为了更全面和灵活地监控服务节点，可以通过多个线程的组合来监控服务节点。当然，线程的数量和线程具体的组合方式可以由本领域技术人员根据实际情况而定。

作为本申请实施例的优选示例，所述步骤401可以具体包括以下子步骤：

子步骤S11，通过第一检查线程获取所述服务节点从服务请求队列中最近取出服务请求的时间点T1，并将与当前时间点N1的时间间隔D1作为响应时间。

子步骤S12，判断所述响应时间是否大于第一预设响应时间阈值，若是，则确定所述服务节点的响应状态异常。

子步骤S13，通过第二检查线程判断所述服务节点的存储单元是否携带存储响应超时标识。

子步骤S14，若是，则将所述存储响应超时标识对应的标识添加时间点T2与当前时间点N2的时间间隔D2作为所述响应时间，若所述响应时间大于第二预设响应时间阈值，则确定所述服务节点的响应状态异常。

上述的第一检查线程可以是关注于服务请求队列响应时间是否异常的线程。通过第一检查线程监控服务节点，可以针对由于处理服务请求队列响应时间过慢所引起服务节点异常的情况进行监控。上述的第二检查线程可以是关注于存储单元响应时间是否异常的线程。通过第二检查线程监控服务节点，可以针对由于存储单元写日志过慢所引起服务节点异常的情况进行监控。需要说明的是，上述子步骤并没有先后之分，即可以同时通过第一检查线程和第二检查线程进行监控。

步骤402，若所述当前服务节点的响应状态异常，则停止所述当前服务节点与备用服务节点之间的通讯，并触发当前服务节点的切换处理。

步骤403，若某个服务节点的响应状态异常，则对所述服务节点添加用于标记不参与当前服务节点的切换处理的异常节点标识。

通过上述的第一检查线程和第二检查线程同时监控服务节点对服务请求的响应状态，可以同时针对处理服务请求队列响应时间和存储单元写日志响应时间进行监控，当任何一方面出现问题，均可以触发服务节点的切换处理，并针对性地添加异常节点标识。从而通过多维度的监控手段提升了服务恢复的全面性和可扩展性。

参照图5，示出了本申请的一种分布式存储系统的服务节点切换装置实施例一的结构框图，所述服务节点包括当前服务节点和备用服务节点，所述装置具体可以包括如下模块：

服务节点响应状态监控模块501，用于监控所述服务节点对服务请求的响应状态。

当前服务节点切换触发模块502，用于若所述当前服务节点的响应状态异常，则停止所述当前服务节点与备用服务节点之间的通讯，并触发当前服务节点的切换处理。

参照图6，示出了本申请的一种分布式存储系统的服务节点切换装置实施例二的结构框图，所述服务节点包括当前服务节点和备用服务节点，所述装置具体可以包括如下模块：

监控结果注册模块601，用于将对至少一个所述服务节点的监控结果注册到监控结果注册列表。

服务节点响应状态监控模块602，用于监控所述服务节点对服务请求的响应状态。

当前服务节点切换触发模块603，用于若所述当前服务节点的响应状态异常，则停止所述当前服务节点与备用服务节点之间的通讯，并触发当前服务节点的切换处理。

异常节点标识添加模块604，用于若某个服务节点的响应状态异常，则对所述服务节点添加用于标记不参与当前服务节点的切换处理的异常节点标识。

监控频率确定模块605，用于将所述多线程的个数除以所述预设响应时间阈值的结果作为监控所述服务节点响应状态的频率。

作为本申请实施例的优选示例，所述装置可以还包括：

存储单元响应时间确定模块，用于通过日志记录线程获取所述服务节点的存储单元写日志的起止时间，并将所述起止时间的时间间隔作为存储单元响应时间。

作为本申请实施例的优选示例，所述当前服务节点切换触发模块603可以包括以下子模块：

作为本申请实施例的优选示例，所述服务节点响应状态监控模块602可以包括以下子模块：

作为本申请实施例的优选示例一，所述多线程监控子模块可以包括以下子单元：

第一检查线程子单元，用于通过第一检查线程获取所述服务节点从服务请求队列中最近取出服务请求的时间点T1，并将与当前时间点N1的时间间隔D1作为响应时间。

作为本申请实施例的优选示例二，所述多线程监控子模块可以包括以下子单元：

第二检查线程子单元，用于通过第二检查线程判断所述服务节点的存储单元是否携带存储响应超时标识；若是，则调用第二预设响应时间阈值判断子单元。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

在一个典型的配置中，所述计算机设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非持续性的电脑可读媒体(transitory media)，如调制的数据信号和载波。

本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本申请所提供的一种分布式存储系统的服务节点切换方法和一种分布式存储系统的服务节点切换装置，进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种分布式存储系统的服务节点切换方法，所述服务节点包括当前服务节点和备用服务节点，其特征在于，所述方法包括：

监控所述服务节点对服务请求的响应状态；

若所述当前服务节点的响应状态异常，则停止所述当前服务节点与备用服务节点之间的通讯，并触发当前服务节点的切换处理。
根据权利要求1所述的方法，其特征在于，还包括：

若某个服务节点的响应状态异常，则对所述服务节点添加用于标记不参与当前服务节点的切换处理的异常节点标识。
根据权利要求2所述的方法，其特征在于，所述触发当前服务节点的切换处理的步骤包括：

触发选取至少一个没有携带所述异常节点标识的服务节点作为新的当前服务节点，替换响应状态异常的当前服务节点。
根据权利要求1所述的方法，其特征在于，所述监控所述服务节点对服务请求的响应状态的步骤包括：

通过多线程监控所述服务节点对服务请求的响应状态。
根据权利要求4所述的方法，其特征在于，所述通过多线程监控所述服务节点对服务请求的响应状态的步骤包括：

通过第一检查线程获取所述服务节点从服务请求队列中最近取出服务请求的时间点T1，并将与当前时间点N1的时间间隔D1作为响应时间；

判断所述响应时间是否大于第一预设响应时间阈值，若是，则确定所述服务节点的响应状态异常。
根据权利要求4所述的方法，其特征在于，所述通过多线程监控所述服务节点对服务请求的响应状态的步骤包括：

通过第二检查线程判断所述服务节点的存储单元是否携带存储响应超时标识；

若是，则将所述存储响应超时标识对应的标识添加时间点T2与当前时间点N2的时间间隔D2作为所述响应时间，若所述响应时间大于第二预设响应时间阈值，则确定所述服务节点的响应状态异常。
根据权利要求6所述的方法，其特征在于，在所述通过多线程监控所述服务节点对服务请求的响应状态的步骤之前，所述方法还包括：

通过日志记录线程获取所述服务节点的存储单元写日志的起止时间，并将所述起止时间的时间间隔作为存储单元响应时间；

判断所述存储单元响应时间是否大于第三预设响应时间阈值，若是，则针对所述存储单元添加所述存储响应超时标识，并相应记录添加标识的时间点T2。
根据权利要求7所述的方法，其特征在于，还包括：

若所述存储单元响应时间小于所述第三预设响应时间阈值、且所述存储单元已经携带有所述存储响应超时标识，则删除所述存储响应超时标识。
根据权利要求1所述的方法，其特征在于，在所述监控所述服务节点对服务请求的响应状态的步骤之前，所述方法还包括：

将对至少一个所述服务节点的监控结果注册到监控结果注册列表；

所述监控所述服务节点对服务请求的响应状态的步骤为：

在所述监控结果注册列表的起始位置轮询注册的监控结果。
根据权利要求4所述的方法，其特征在于，还包括：

将所述多线程的个数除以所述预设响应时间阈值的结果作为监控所述服务节点响应状态的频率。
一种分布式存储系统的服务节点切换装置，所述服务节点包括当前服务节点和备用服务节点，其特征在于，所述装置包括：

服务节点响应状态监控模块，用于监控所述服务节点对服务请求的响应状态；

当前服务节点切换触发模块，用于若所述当前服务节点的响应状态异常，则停止所述当前服务节点与备用服务节点之间的通讯，并触发当前服务节点的切换处理。
根据权利要求11所述的装置，其特征在于，所述装置还包括：

异常节点标识添加模块，用于若某个服务节点的响应状态异常，则对所述服务节点添加用于标记不参与当前服务节点的切换处理的异常节点标识。
根据权利要求12所述的装置，其特征在于，所述当前服务节点切换触发模块包括：

触发选取子模块，用于触发选取至少一个没有携带所述异常节点标识的服务节点作为新的当前服务节点，替换响应状态异常的当前服务节点。
根据权利要求11所述的装置，其特征在于，所述服务节点响应状态监控模块包括：

多线程监控子模块，用于通过多线程监控所述服务节点对服务请求的响应状态。
根据权利要求14所述的装置，其特征在于，所述多线程监控子模块包括：

第一检查线程子单元，用于通过第一检查线程获取所述服务节点从服务请求队列中最近取出服务请求的时间点T1，并将与当前时间点N1的时间间隔D1作为响应时间；

第一预设响应时间阈值判断子单元，用于判断所述响应时间是否大于第一预设响应时间阈值，若是，则确定所述服务节点的响应状态异常。
根据权利要求14所述的装置，其特征在于，所述多线程监控子模块包括：

第二检查线程子单元，用于通过第二检查线程判断所述服务节点的存储单元是否携带存储响应超时标识；若是，则调用第二预设响应时间阈值判断子单元；

第二预设响应时间阈值判断子单元，用于将所述存储响应超时标识对应的标识添加时间点T2与当前时间点N2的时间间隔D2作为所述响应时间，若所述响应时间大于第二预设响应时间阈值，则确定所述服务节点的响应状态异常。
根据权利要求16所述的装置，其特征在于，所述装置还包括：

存储单元响应时间确定模块，用于通过日志记录线程获取所述服务节点的存储单元写日志的起止时间，并将所述起止时间的时间间隔作为存储单元响应时间；

存储响应超时标识添加模块，用于判断所述存储单元响应时间是否大于第三预设响应时间阈值，若是，则针对所述存储单元添加所述存储响应超时标识，并相应记录添加标识的时间点T2。
根据权利要求17所述的装置，其特征在于，所述装置还包括：

存储响应超时标识删除模块，用于若所述存储单元响应时间小于所述第三预设响应时间阈值、且所述存储单元已经携带有所述存储响应超时标识，则删除所述存储响应超时标识。
根据权利要求11所述的装置，其特征在于，所述装置还包括：

监控结果注册模块，用于将对至少一个所述服务节点的监控结果注册到监控结果注册列表；

所述服务节点响应状态监控模块包括：

监控结果轮询子模块，用于在所述监控结果注册列表的起始位置轮询注册的监控结果。
根据权利要求14所述的装置，其特征在于，所述装置还包括：

监控频率确定模块，用于将所述多线程的个数除以所述预设响应时间阈值的结果作为监控所述服务节点响应状态的频率。