CN113836085A

CN113836085A - 一种故障迁移方法及装置

Info

Publication number: CN113836085A
Application number: CN202111134321.7A
Authority: CN
Inventors: 寇墨林; 逄新; 谢乾阳
Original assignee: China Construction Bank Corp
Current assignee: China Construction Bank Corp
Priority date: 2021-09-27
Filing date: 2021-09-27
Publication date: 2021-12-24

Abstract

本申请公开了一种故障迁移方法及装置，在各个预设的时间节点内向分布式文件系统的NAS机头发送心跳探测信息，若检测到连续多个时间点未接收到回复信息，确定NAS机头处于心跳丢失状态并向NAS机头发送探测指令，若未接收到探测返回信号，确定NAS机头处于故障状态，对分布式文件系统执行故障迁移操作。基于上述，通过确定NAS机头是否处于心跳丢失状态和确定NAS机头是否处于故障状态来健全故障判别机制，及时定位到发生故障的分布式文件系统，对发生故障的分布式文件系统进行迁移，由于故障判别机制和分布式文件系统迁移的流程为全自动，去掉了人工干预的影响，减少分布式文件系统迁移的时间，提高分布式文件系统迁移的效率。

Description

一种故障迁移方法及装置

技术领域

本申请涉及数据处理技术领域，更具体地说，涉及一种故障迁移方法及装置。

背景技术

分布式文件系统存储提供了可拓展的共享文件系统存储服务，可以与云虚拟机等服务搭配使用，并且其提供了标准的网络文件系统(NetworkFile System，NFS)访问协议，为多台云虚拟机或者其他计算服务提供共享的数据源，支持弹性容量和性能的扩展，适用于大数据分析、媒体处理和内容管理等多种场景。

当分布式文件系统出现故障时，需要对分布式文件系统的故障进行迁移，目前，关于分布式文件系统的故障迁移方法多数需要人工进行干预，人工干预的迁移方法使分布式文件系统的迁移所花费的时间多，从而造成对业务的影响时间长，并且迁移效率低。

因此，现有的分布式文件系统的故障迁移的所花费的时间多且迁移效率低。

发明内容

有鉴于此，本申请公开了一种故障迁移方法及装置，旨在减少分布式文件迁移的时间，提高分布式文件迁移的效率。

为了实现上述目的，其公开的技术方案如下：

本申请第一方面公开了一种故障迁移方法，所述方法包括：

在各个预设的时间节点内向分布式文件系统的NAS机头发送心跳探测信息；

当检测到连续多个时间点未接收到所述心跳探测信息对应的回复信息时，确定所述NAS机头处于心跳丢失状态；

在所述NAS机头处于所述心跳丢失状态下，向所述NAS机头发送探测指令；

若未接收到所述探测指令对应的探测返回信号，则确定所述NAS机头处于故障状态，并对所述分布式文件系统执行故障迁移操作。

优选的，所述在各个预设的时间节点向分布式文件系统中的NAS机头发送心跳探测信息，包括：

在各个预设的时间节点内，通过NAS机头管控节点的心跳探测进程向分布式文件系统中的NAS机头发送心跳探测信息。

优选的，所述在所述NAS机头处于所述心跳丢失状态下，向所述NAS机头发送探测指令，包括：

在所述NAS机头处于所述心跳丢失状态下，通过NAS机头管控节点的探测进程向所述NAS机头发送探测指令。

优选的，所述对所述分布式文件系统执行故障迁移操作，包括：

通过预设顺序获取处于故障状态的NAS机头中的n个待迁移文件系统；所述预设顺序由所述n个待迁移文件系统的大小确定；所述n为正整数；

将所述n个待迁移文件系统迁移至多个目标NAS机头；所述多个目标NAS机头由负载度和文件挂载数量确定；

在所述多个目标NAS机头上进行配置nfsd进程操作、云硬盘挂载操作、添加权限组操作和建立路由表操作；所述配置nfsd进程操作用于使所述各个目标NAS机头具有挂载操作功能；所述建立路由表操作用于确保所述n个待迁移文件系统与所述目标NAS机头处于通信状态。

优选的，在所述对所述分布式文件系统执行故障迁移操作之前，还包括：

删除所述处于故障状态的NAS机头对应的路由表，并将所述处于故障状态的NAS机头与云硬盘进行解绑操作。

本申请第二方面公开了一种故障迁移装置，所述装置包括：

第一发送单元，用于在各个预设的时间节点内向分布式文件系统的NAS机头发送心跳探测信息；

确定单元，用于当检测到连续多个时间点未接收到所述心跳探测信息对应的回复信息时，确定所述NAS机头处于心跳丢失状态；

第二发送单元，用于在所述NAS机头处于所述心跳丢失状态下，向所述NAS机头发送探测指令；

执行单元，用于若未接收到所述探测指令对应的探测返回信号，则确定所述NAS机头处于故障状态，并对所述分布式文件系统执行故障迁移操作。

优选的，所述第一发送单元，具体用于：

优选的，所述第二发送单元，具体用于：

优选的，所述执行单元，包括：

获取模块，用于通过预设顺序获取处于故障状态的NAS机头中的n个待迁移文件系统；所述预设顺序由所述n个待迁移文件系统的大小确定；所述n为正整数；

迁移模块，用于将所述n个待迁移文件系统迁移至多个目标NAS机头；所述多个目标NAS机头由负载度和文件挂载数量确定；

操作模块，用于在所述多个目标NAS机头上进行配置nfsd进程操作、云硬盘挂载操作、添加权限组操作和建立路由表操作；所述配置nfsd进程操作用于使所述各个目标NAS机头具有挂载操作功能；所述建立路由表操作用于确保所述n个待迁移文件系统与所述目标NAS机头处于通信状态。

优选的，还包括：

操作单元，用于删除所述处于故障状态的NAS机头对应的路由表，并将所述处于故障状态的NAS机头与云硬盘进行解绑操作。

经由上述技术方案可知，本申请公开了一种故障迁移方法及装置，在各个预设的时间节点内向分布式文件系统中的NAS机头发送心跳探测信息，当检测到连续多个时间点未接收到心跳探测信息对应的回复信息时，确定NAS机头处于心跳丢失状态，在NAS机头处于所述心跳丢失状态下，向NAS机头发送探测指令，若未接收到探测指令对应的探测返回信号，则确定NAS机头处于故障状态，并对分布式文件系统执行故障迁移操作。基于上述，通过确定NAS机头是否处于心跳丢失状态和确定NAS机头是否处于故障状态来健全故障判别机制，及时定位到发生故障的分布式文件系统，并对发生故障的分布式文件系统进行故障迁移，由于故障判别机制和分布式文件系统迁移的流程为全自动，去掉了人工干预的影响，减少分布式文件系统迁移的时间，提高分布式文件系统迁移的效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例公开的一种故障迁移方法的流程示意图；

图2为本申请实施例公开的对分布式文件系统执行故障迁移操作的流程示意图；

图3为本申请实施例公开的一种故障迁移装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本申请中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

由背景技术可知，现有的分布式文件存储的故障迁移的所花费的时间多且迁移效率低。

为了解决上述问题，本申请实施例公开了一种故障迁移方法及装置，通过确定NAS机头是否处于心跳丢失状态和确定NAS机头是否处于故障状态来健全故障判别机制，及时定位到发生故障的分布式文件，对发生故障的分布式文件进行迁移，由于故障判别机制和分布式文件迁移的流程为全自动，去掉了人工干预的影响，减少分布式文件迁移的时间，提高分布式文件迁移的效率。具体实现方式由下述实施例进行说明。

参考图1所示，为本申请实施例公开的一种故障迁移方法的流程示意图，该故障迁移方法主要包括如下步骤：

S101：在各个预设的时间节点内向分布式文件系统的NAS机头发送心跳探测信息。

在S101中，分布式文件系统所在的每一个机头管控组件(Nas_Agent)都具有保活机制，即，NAS机头的管控节点上有着心跳探测进程，在各个预设的时间节点内都会发往机头一次心跳探测。

分布式文件系统提供了可拓展的共享文件存储服务，可以与云虚拟机等服务搭配使用。其提供了标准的网络文件(NetFileSystem，NFS)访问协议，为多台云虚拟机或者其他计算服务提供共享的数据源，支持弹性容量和性能的扩展，现有的应用无需修改即可挂载使用，特点为高可用和高可靠，适用于大数据分析、媒体处理和内容管理等多种场景。

其中，NFS文件系统通过网络实现文件共享的一种网络协议。它允许网络中的计算机之间共享资源。在NFS的应用中，本地NFS的客户端应用可以透明地读写位于远端NFS服务器上的文件，就像访问本地文件一样。

Nas机头为文件存储核心的生产组件。Nas机头为落在其上面的分布式文件系统提供核心服务，配合该组件安装时配装的机头预装插件，负责管理机头上的核心服务拉起，并挂载用户的分布式文件系统。

在各个预设的时间节点内，通过NAS机头管控节点的心跳探测进程向分布式文件中的NAS机头发送心跳探测信息。

预设的时间节点可以是每1秒，每2秒等，具体预设的时间节点的确定由技术人员根据实际情况进行设置，本申请不做具体限定。本申请的预设的时间节点优选每1秒。

在每1秒内，通过NAS机头管控节点的心跳探测进程向分布式文件中的NAS机头发送心跳探测信息。

分布式文件系统的存储架构基本分为四层接入层、管控层、NAS机头层和后端存储池四层，四层功能介绍主要如下：

接入层：提供前端控制台功能，和机头监控数据进行上报，针对机头业务监控，涉及用量、流量、cpu等，上报给监控模块。

管控层：接收管控层请求，为前端提供http及json的api；并发起cfs的业务逻辑，和管控机头节点存活和负载均衡。

NAS机头层：文件系统增删改落地实现(格盘、落盘、权限管理等)，并实现nfsd协议服务。

后端数据存储池：数据的本地存储。

其中，分布式文件存储的数据io流分析如下：客户端依据linux文件系统机制通过NFS客户端将io数据封装成tcp/ip包，发送到NAS机头，NAS机头根据io请求包的信息，分析读写权限及需求，进行数据的io读写。

S102：当检测到连续多个时间点未接收到心跳探测信息对应的回复信息时，确定NAS机头处于心跳丢失状态。

在S102中，NAS机头的管控节点上的心跳探测进程检测到连续多个时间点未接收到发往NAS机头的心跳探测信息对应的回复信息，确定NAS机头处于心跳丢失状态，并将NAS机头的心跳标记为丢失。

为了方便理解当检测到连续多个时间点未接收到心跳探测信息对应的回复信息时，确定NAS机头处于心跳丢失状态的过程，这里举例进行说明：

例如，NAS机头的管控节点上的心跳探测进程检查到发往NAS机头的心跳探测信息在连续5秒内已经超过了5次没有得到回复，此时判定NAS机头丢失了心跳，即，确定NAS机头处于心跳丢失状态。

S103：在NAS机头处于心跳丢失状态下，向NAS机头发送探测指令。

在S103中，在NAS机头处于心跳丢失状态下，通过NAS机头管控节点的探测进程向NAS机头发送探测指令。

探测指令用于探测NAS机头是否处于故障状态。

S104：若未接收到探测指令对应的探测返回信号，则确定NAS机头处于故障状态，并对分布式文件系统执行故障迁移操作。

在S104中，若未接收到探测指令对应的探测返回信号，则确定NAS机头处于故障状态，触发NAS机头高可用，即对落在处于故障状态NAS机头上的分布式文件系统执行故障迁移操作。

在对分布式文件执行故障迁移操作之前，删除处于故障状态的NAS机头对应的路由表，并将处于故障状态的NAS机头与云硬盘进行解绑操作。

其中，NAS机头管控节点Master向虚拟私有云(VirtualPrivateCloud，VPC)的管控端发送请求，删除虚拟私有云侧的分布式文件系统网络协议(InternetProtocol，IP)与处于故障状态的NAS机头相关的路由表。

路由表的主要作用是供路由器查找目标网络，进而确定转发接口以及下一条路由，完成数据包的转发功能。删除路由表即切断了要迁移的分布式文件系统与处于故障状态的NAS机头之间网络的联系。

虚拟私有云，为弹性云服务器构建隔离的、用户自主配置和管理的虚拟网络环境，提升云上资源的安全性，简化用户的网络部署。

NAS机头管控节点Master向存储分布式文件系统数据的云硬盘管控端发送请求，将分布式文件系统所在的旧的处于故障状态的NAS机头与云硬盘进行解绑，该步骤为接下来新的NAS机头(处于正常状态的NAS机头)挂载云硬盘的前置条件。

具体对分布式文件执行故障迁移操作的过程如下：

首先，通过预设顺序获取处于故障状态的NAS机头中的n个待迁移文件系统；预设顺序由n个待迁移文件系统的大小确定，n为正整数。

其中，对处于故障状态的NAS机头中的n个待迁移文件系统由数据容量的大到小进行排序，以便于先将数据容量最大的待迁移文件系统迁移至负载度最低的目标NAS机头中，其他数据容量由大到小的待迁移文件系统对应迁移至负载度由低至高的目标NAS机头中，n的取值可以为16。

NAS机头管控节点Master连接分布式文件系统的数据库，查找落在处于故障状态的NAS机头上的所有分布式文件系统，并对这些分布式文件系统进行从大到小的排序，同时将发生故障的机头在数据库中的状态置为不可用，这样做的目的是为了防止在迁移过程中用户侧创建的文件系统落在该故障机头上，保证业务系统的可用性。

在分布式文件系统容量的维度上由大到小进行排序，使得在NAS机头的数据库状态修改后选择分布式文件系统容量的维度上由大至小进行排序，得到布式文件系统容量的前16个分布式文件系统并进行迁移操作，选择布式文件系统容量的16个文件系统的原因是处理迁移过程的进程nas_master_mcd是单线程，支持异步，在迁移的时候会发起16个异步任务，每个异步任务迁移一个文件系统，16个任务有完成就会立即补充一个任务，时刻保持这16个文件系统是处于在迁移中的状态。

选择16这个数字是因为分布式文件系统迁移的时候会发起且最多发起16个异步任务，文件系统的最大迁移数就是16，保持迁移速度的情况下选择了16。

然后，将n个待迁移文件迁移至多个目标NAS机头；多个目标NAS机头由负载度和文件挂载数量确定。

其中，NAS机头的管控节点Master从负载均衡的全局角度出发，会优先选择负载较轻、挂载文件系统数量较少的机头作为迁移的目标机头。假设有4个目标机头接收被迁移的文件系统，迁移16个文件系统，每个机头最大可分配4个文件系统的迁移任务，保证迁移后各机头维持一个负载均衡的状态。

最后，在多个目标NAS机头上进行配置nfsd进程操作、云硬盘挂载操作、添加权限组操作和建立路由表操作；配置nfsd进程操作用于使各个目标NAS机头具有挂载操作功能；建立路由表操作用于确保n个待迁移文件与目标NAS机头处于通信状态。

其中，NAS机头的管控节点Master向存储分布式文件系统数据的云硬盘管控端发送请求，将文件系统要迁移至的目标NAS机头与之前分布式文件系统数据的云硬盘进行绑定，保证了迁移前后分布式文件系统数据的一致性和可靠性。

通过对目标机头配置相关进程的方式实现目标NAS机头对迁移的分布式文件系统进行挂载，即对分布式文件系统要迁移至的目标NAS机头配置nfsd进程，使其具有挂载及管控文件系统的能力，实现新目标NAS机头对迁移文件系统的管控。

NAS机头的管控节点Master给目标NAS机头添加文件系统的权限限制，保证分布式文件系统迁移前后的权限组规则是一致的，通过校验机制保证迁移前后权限组规则的一致性。

权限组规则是租户设置的权限组规则，而非运维人员设置的，每个文件系统的权限规则各不相同。

NAS机头的管控节点Master向虚拟私有云的管控端发送请求，添加虚拟私有云侧的分布式文件系统网络协议与新的目标机头网络协议相关的路由表。保证了发生迁移的文件系统与目标机头之间的网络连接。

在故障检测方面看，本申请有着健全的故障检测机制，相比人工介入可以有效提升故障响应速度，第一时间进行分布式文件系统的迁移，大大缩短了对用户业务的影响时间。从分布式文件系统迁移过程上看，通过考虑负载均衡设计了巧妙的分布式文件系统排序机制和目标NAS机头选择机制，按批次发起异步任务进行迁移，保证业务系统的连续性和可用性。从数据安全上看，有着完善的安全校验机制，保证了分布式文件系统迁移前后其数据的一致性和可靠性。

本申请从分布式文件系统存储自动迁移的角度出发，不需要使用新服务器系统共享出来的存储空间作为中介容器，节省了大量资源。并且通过健全的故障判别机制及时定位到受到影响的分布式文件系统存储，及时响应并触发分布式文件系统存储的迁移。由于故障判别和文件装置迁移的流程为全自动，去掉了人工干预的影响，所以迁移响应时间短、迁移效率高，使得用户侧的业务影响大幅减少。本申请还有着完善的安全校验机制，保证了分布式文件系统迁移前后其数据的一致性和可靠性。整体流程上采用了全自动的故障检测以及迁移方式，解放了运维工程师的人力资源占用，减轻工作量的同时提高了运维效率。

本申请实施例中，通过确定NAS机头是否处于心跳丢失状态和确定NAS机头是否处于故障状态来健全故障判别机制，及时定位到发生故障的分布式文件，对发生故障的分布式文件进行迁移，由于故障判别机制和分布式文件迁移的流程为全自动，去掉了人工干预的影响，减少分布式文件迁移的时间，提高分布式文件迁移的效率。

参考图2所示，为上述S104中涉及到对分布式文件系统执行故障迁移操作的过程，主要包括如下步骤：

S201：通过预设顺序获取处于故障状态的NAS机头中的n个待迁移文件系统；预设顺序由n个待迁移文件的大小确定；n为正整数。

S202：将n个待迁移文件系统迁移至多个目标NAS机头；多个目标NAS机头由负载度和文件挂载数量确定。

S203：在多个目标NAS机头上进行配置nfsd进程操作、云硬盘挂载操作、添加权限组操作和建立路由表操作；配置nfsd进程操作用于使各个目标NAS机头具有挂载操作功能；建立路由表操作用于确保n个待迁移文件与目标NAS机头处于通信状态。

S201-S203的执行原理与上述S104的执行原理一致，可参考，此处不再进行赘述。

本申请实施例中，通过预设顺序获取处于故障状态的NAS机头中的n个待迁移文件，通过预设顺序获取处于故障状态的NAS机头中的n个待迁移文件，将n个待迁移文件迁移至多个目标NAS机头，对多个目标NAS机头上进行配置nfsd进程操作、云硬盘挂载操作、添加权限组操作和建立路由表操作，便于后续对分布式文件系统执行故障迁移操作。

基于上述实施例图1公开的一种故障迁移方法，本申请实施例还对应公开了一种故障迁移装置，如图3所示，该故障迁移装置包括第一发送单元301、确定单元302、第二发送单元303和执行单元304。

第一发送单元301，用于在各个预设的时间节点内向分布式文件系统的NAS机头发送心跳探测信息。

确定单元302，用于当检测到连续多个时间点未接收到心跳探测信息对应的回复信息时，确定NAS机头处于心跳丢失状态。

第二发送单元303，用于在NAS机头处于心跳丢失状态下，向NAS机头发送探测指令。

执行单元304，用于若未接收到探测指令对应的探测返回信号，则确定NAS机头处于故障状态，并对分布式文件系统执行故障迁移操作。

进一步的，第一发送单元301具体用于在各个预设的时间节点内，通过NAS机头管控节点的心跳探测进程向分布式文件中的NAS机头发送心跳探测信息。

进一步的，第二发送单元303，具体用于在NAS机头处于心跳丢失状态下，通过NAS机头管控节点的探测进程向NAS机头发送探测指令。

进一步的，执行单元304包括获取模块、迁移模块和操作模块。

获取模块，用于通过预设顺序获取处于故障状态的NAS机头中的n个待迁移文件系统；预设顺序由n个迁移文件的大小确定；n为正整数。

迁移模块，用于将n个待迁移文件系统迁移至多个目标NAS机头；多个目标NAS机头由负载度和文件挂载数量确定。

操作模块，用于在多个目标NAS机头上进行配置nfsd进程操作、云硬盘挂载操作、添加权限组操作和建立路由表操作；配置nfsd进程操作用于使各个目标NAS机头具有挂载操作功能；建立路由表操作用于确保n个待迁移文件系统与目标NAS机头处于通信状态。

进一步的，故障迁移装置还包括删除单元。

删除单元，用于删除处于故障状态的NAS机头对应的路由表，并将处于故障状态的NAS机头与云硬盘进行解绑操作。

本申请实施例中，通过确定NAS机头是否处于心跳丢失状态和确定NAS机头是否处于故障状态来健全故障判别机制，及时定位到发生故障的分布式文件，对发生故障的分布式文件进行迁移，由于故障判别机制和分布式文件迁移的流程为全自动，去掉了人工干预的影响，减少分布式文件系统迁移的时间，提高分布式文件系统迁移的效率。

对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本申请各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种故障迁移方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述在各个预设的时间节点向分布式文件系统中的NAS机头发送心跳探测信息，包括：

3.根据权利要求1所述的方法，其特征在于，所述在所述NAS机头处于所述心跳丢失状态下，向所述NAS机头发送探测指令，包括：

4.根据权利要求1所述的方法，其特征在于，所述对所述分布式文件系统执行故障迁移操作，包括：

5.根据权利要求1所述的方法，其特征在于，在所述对所述分布式文件系统执行故障迁移操作之前，还包括：

6.一种故障迁移装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述第一发送单元，具体用于：

8.根据权利要求6所述的装置，其特征在于，所述第二发送单元，具体用于：

9.根据权利要求6所述的装置，其特征在于，所述执行单元，包括：

10.根据权利要求6所述的装置，其特征在于，还包括：