CN114553900B - 一种分布式块存储管理系统、方法及电子设备 - Google Patents

一种分布式块存储管理系统、方法及电子设备 Download PDF

Info

Publication number
CN114553900B
CN114553900B CN202210151978.2A CN202210151978A CN114553900B CN 114553900 B CN114553900 B CN 114553900B CN 202210151978 A CN202210151978 A CN 202210151978A CN 114553900 B CN114553900 B CN 114553900B
Authority
CN
China
Prior art keywords
storage node
distributed block
target storage
management
block storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210151978.2A
Other languages
English (en)
Other versions
CN114553900A (zh
Inventor
张廷雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210151978.2A priority Critical patent/CN114553900B/zh
Publication of CN114553900A publication Critical patent/CN114553900A/zh
Application granted granted Critical
Publication of CN114553900B publication Critical patent/CN114553900B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请提供一种分布式块存储管理系统、方法及电子设备,该系统包括:分布式块存储集群、客户端和多个存储节点,每个存储节点上均设有任务分发器;客户端用于获取用户输入的分布式块存储管理请求,并将分布式块管理请求发送到绑定有虚拟IP的目标存储节点,目标存储节点上的任务分发器用于监测目标存储节点是否故障,若是,则重新确定目标存储节点,并将虚拟IP切换到新的目标存储节点;分布式块存储集群基于虚拟IP,将管理结果发送到新的目标存储节点。通过在原始的目标存储节点发生故障时,将虚拟IP切换到其他正常存储节点上,使分布式块存储集群能够基于其他正常的存储节点上报管理结果,提高了分布式块存储管理效率。

Description

一种分布式块存储管理系统、方法及电子设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种分布式块存储管理系统、方法及电子设备。
背景技术
在云计算时代,分布式块存储的应用越来越广泛,普通用户可以基于分布式块存储管理系统中的存储节点,管理分布式块存储集群的资源分配,例如创建卷、删除卷、查看卷和拷贝卷等。
但是,当存储节点在向分布式块存储集群发送完管理请求后发生断电或者通信故障时,分布式块存储集群将无法基于该存储节点向分布式块存储管理系统反馈管理结果,这就导致用户需要重新基于分布式块存储管理系统发起新的管理操作,降低了分布式块存储管理效率。
发明内容
本申请提供一种分布式块存储管理系统、方法及电子设备,以解决现有技术降低了分布式块存储管理效率等缺陷。
本申请第一个方面提供一种分布式块存储管理系统,包括:分布式块存储集群、客户端和多个存储节点,每个存储节点上均设有任务分发器;
所述客户端用于获取用户输入的分布式块存储管理请求,并将所述分布式块管理请求发送到绑定有虚拟IP的目标存储节点;
所述目标存储节点根据所述分布式块管理请求,对分布式块存储集群进行管理操作;
所述目标存储节点上的任务分发器用于监测所述目标存储节点是否故障,若是,则重新确定目标存储节点,并将所述虚拟IP切换到新的目标存储节点;
所述分布式块存储集群基于所述虚拟IP,将管理结果发送到所述新的目标存储节点,以基于所述新的目标存储节点,将所述管理结果反馈到所述客户端。
可选的,所述任务分发器,具体用于:
按照预设周期,向所属的存储节点发送心跳信号;
根据所述存储节点对所述心跳信号的反馈情况,判断所述存储节点是否故障。
可选的,各所述任务分发器之间设有通信连接。
可选的,所述目标存储节点上的任务分发器,还用于:
基于所述各所述任务分发器之间设有通信连接,获取其他任务分发器的存储节点故障监测结果。
可选的,所述目标存储节点上的任务分发器,具体用于:
根据所述其他任务分发器的存储节点故障监测结果,确定正常存储节点;
当所述目标存储节点发生故障时,将任一所述正常存储节点确定为新的目标存储节点。
可选的,所述任务分发器包括RBD客户端。
可选的,所述目标存储节点上的任务分发器,具体用于:
监测所述目标存储节点与所述RBD客户端之间的连接是否异常;
当所述目标存储节点与所述RBD客户端之间的连接异常时,确定所述目标存储节点发生故障。
本申请第二个方面提供一种分布式块存储管理方法,包括:
获取用户输入的分布式块存储管理请求,并将所述分布式块管理请求发送到绑定有虚拟IP的目标存储节点;
基于所述目标存储节点根据所述分布式块管理请求,对分布式块存储集群进行管理操作;
监测所述目标存储节点是否故障,若是,则重新确定目标存储节点,并将所述虚拟IP切换到新的目标存储节点;
控制所述分布式块存储集群基于所述虚拟IP,将管理结果发送到所述新的目标存储节点,以基于所述新的目标存储节点,向上层反馈所述管理结果。
可选的,所述监测所述目标存储节点是否故障,包括:
按照预设周期,向目标存储节点发送心跳信号;
根据所述目标存储节点对所述心跳信号的反馈情况,判断所述目标存储节点是否故障。
可选的,所述方法,还包括:
获取其他存储节点故障监测结果。
可选的,所述重新确定目标存储节点,包括:
根据所述其他存储节点故障监测结果,确定正常存储节点;
当所述目标存储节点发生故障时,将任一所述正常存储节点确定为新的目标存储节点。
可选的,所述存储节点包括RBD客户端。
可选的,所述监测所述目标存储节点是否故障,包括:
监测所述目标存储节点与所述RBD客户端之间的连接是否异常;
当所述目标存储节点与所述RBD客户端之间的连接异常时,确定所述目标存储节点发生故障。
本申请第三个方面提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一个方面以及第一个方面各种可能的设计所述的方法。
本申请第四个方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一个方面以及第一个方面各种可能的设计所述的方法。
本申请技术方案,具有如下优点:
本申请提供一种分布式块存储管理系统、方法及电子设备,该系统包括:分布式块存储集群、客户端和多个存储节点,每个存储节点上均设有任务分发器;客户端用于获取用户输入的分布式块存储管理请求,并将分布式块管理请求发送到绑定有虚拟IP的目标存储节点,目标存储节点根据分布式块管理请求,对分布式块存储集群进行管理操作;目标存储节点上的任务分发器用于监测目标存储节点是否故障,若是,则重新确定目标存储节点,并将虚拟IP切换到新的目标存储节点;分布式块存储集群基于虚拟IP,将管理结果发送到新的目标存储节点,以基于新的目标存储节点,将管理结果反馈到客户端。上述方案提供的系统,通过在原始的目标存储节点发生故障时,将虚拟IP切换到其他正常存储节点上,使此时的分布式块存储集群能够基于其他正常的存储节点上报管理结果,提高了分布式块存储管理效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的分布式块存储管理系统的结构示意图;
图2为本申请实施例提供的示例性的分布式块存储管理系统的工作流程示意图;
图3为本申请实施例提供的分布式块存储管理方法的流程示意图;
图4为本申请实施例提供的电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。在以下各实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。
在现有技术中,当存储节点在向分布式块存储集群发送完管理请求后发生断电或者通信故障时,分布式块存储集群将无法基于该存储节点向分布式块存储管理系统反馈管理结果,这就导致用户需要重新基于分布式块存储管理系统发起新的管理操作,耗费时间,降低了分布式块存储管理效率,同时存在执行失败的风险。
针对上述问题,本申请实施例提供的分布式块存储管理系统、方法及电子设备,包括:分布式块存储集群、客户端和多个存储节点,每个存储节点上均设有任务分发器;客户端用于获取用户输入的分布式块存储管理请求,并将分布式块管理请求发送到绑定有虚拟IP的目标存储节点,目标存储节点根据分布式块管理请求,对分布式块存储集群进行管理操作;目标存储节点上的任务分发器用于监测目标存储节点是否故障,若是,则重新确定目标存储节点,并将虚拟IP切换到新的目标存储节点;分布式块存储集群基于虚拟IP,将管理结果发送到新的目标存储节点,以基于新的目标存储节点,将管理结果反馈到客户端。上述方案提供的系统,通过在原始的目标存储节点发生故障时,将虚拟IP切换到其他正常存储节点上,使此时的分布式块存储集群能够基于其他正常的存储节点上报管理结果,提高了分布式块存储管理效率。
下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明实施例进行描述。
本申请实施例提供了一种分布式块存储管理系统,用于管理分布式块存储集群。
如图1所示,为本申请实施例提供的分布式块存储管理系统的结构示意图,该分布式块存储管理系统10包括:分布式块存储集群101、客户端102和多个存储节点103,每个存储节点103上均设有任务分发器1031。
其中,客户端用于获取用户输入的分布式块存储管理请求,并将分布式块管理请求发送到绑定有虚拟IP的目标存储节点;目标存储节点根据分布式块管理请求,对分布式块存储集群进行管理操作;目标存储节点上的任务分发器用于监测目标存储节点是否故障,若是,则重新确定目标存储节点,并将虚拟IP切换到新的目标存储节点;分布式块存储集群基于虚拟IP,将管理结果发送到新的目标存储节点,以基于新的目标存储节点,将管理结果反馈到客户端。
需要说明的是,由于用户无法基于客户端直接访问分布式块存储集群,所以客户端与分布式块存储集群之间通常设有存储节点,存储节点可以作为中间客户端,转发分布式块存储管理请求,以帮助用户访问分布式块存储集群。
具体地,当用户需要对分布式块存储集群进行管理时,用户可以向客户端输入分布式块存储管理请求,客户端在得到分布式块存储管理请求后,按照预设的虚拟IP,将该分布式块存储管理请求发送到绑定有该虚拟IP的目标存储节点,以基于该目标存储节点,向分布式块存储集群转发该分布式块存储管理请求。
其中,由于分布式块存储集群需要一定的时间来响应该分布式块存储管理请求,即分布式块存储集群通常在接收到分布式块存储管理请求一段时间后,才能向目标存储节点反馈对应的管理结果。但是在这段时间内,该目标存储节点可能会发生故障,这就导致分布式块存储集群无法正常向该目标存储节点发送管理结果,管理流程将发生中断。本申请实施例提供的分布式块存储管理系统为了保证管理流程能够正常进行,基于目标存储节点上的任务分发器实时监测目标存储节点是否故障,若是,则重新确定目标存储节点,并将虚拟IP切换到新的目标存储节点,以使分布式块存储集群能够继续基于该虚拟IP,将管理结果反馈至对应的存储节点(新的目标存储节点),进而基于该存储节点,将管理结果反馈到客户端。
需要进一步说明的是,虚拟IP是一个不与特定设备(存储节点)的通信接口相连的IP地址。当虚拟IP与某一存储节点的通信接口绑定时,其他设备(如客户端和分布式块存储集群)可以通过虚拟IP与该存储节点建立通信。当该存储节点发生断电或通信异常等故障时,该虚拟IP可以切换至其他正常的存储节点。在本申请实施例中,虚拟IP与任务分发器的请求接收接口绑定,任务分发器可以基于虚拟IP接收客户端下发的分布式块存储管理请求。
其中,对分布式块存储集群进行管理操作包括创建卷、删除卷和拷贝卷等。
在上述实施例的基础上,作为一种可实施的方式,在一实施例中,任务分发器,具体可以按照预设周期,向所属的存储节点发送心跳信号;根据存储节点对心跳信号的反馈情况,判断存储节点是否故障。
具体地,在任务分发器与存储节点建立连接后,可以按照预设周期,向所连接的存储节点发送心跳信号。在存储节点正常的情况下,存储节点将根据接收到的心跳信号,向任务分发器反馈对应的响应信号,以表征其当前处于正常状态。相反地,当存储节点发生断电等故障,该存储节点将无法响应心跳信号,以使与该存储节点建立连接的任务分发器无法在得到心跳信号的响应信号,当任务分发器在预设周期内没有收到心跳信号的响应信号时,任务分发器可以确定该存储节点发生了故障。
具体地,在一实施例中,各任务分发器之间设有通信连接。
相应地,目标存储节点上的任务分发器,还可以基于各任务分发器之间设有通信连接,获取其他任务分发器的存储节点故障监测结果。
其中,任务分发器之间的通信方式可以采用无线通信,也可以采用其他通信方式,具体本申请实施例不做限定。
进一步地,在一实施例中,目标存储节点上的任务分发器,具体可以根据其他任务分发器的存储节点故障监测结果,确定正常存储节点;当目标存储节点发生故障时,将任一正常存储节点确定为新的目标存储节点。
具体地,当目标存储节点上的任务分发器检测到该目标存储节点发生故障时,将自动触发虚拟IP漂移进程,并根据当前获取到的其他各任务分发器的存储节点故障检测结果,确定当前分布式块存储管理系统中哪些存储节点是正常的,进而在这些正常的存储节点中选择新的目标存储节点,并将虚拟IP切换至新的目标存储节点。
其中,任务分发器包括RBD客户端。
具体地,在一实施例中,目标存储节点上的任务分发器,具体可以监测目标存储节点与RBD客户端之间的连接是否异常;当目标存储节点与RBD客户端之间的连接异常时,确定目标存储节点发生故障。
需要说明的是,分布式存储系统(Ceph)对外提供的块设备服务(RADOS BlockDevice,简称:RBD)客户端是分布式块存储集群的访问工具,存储节点通常利用RBD客户端,实现分布式块存储集群的访问和管理。
示例性的,如图2所示,为本申请实施例提供的示例性的分布式块存储管理系统的工作流程示意图。假设当前分布式块存储管理系统包括三个存储节点,初始化的目标存储节点为第一个存储节点(存储节点1),即在正常场景下,虚拟IP绑定在存储节点1,当存储节点1上的任务分发器监测到存储节点1与RBD客户端之间的连接异常时,则可以确定存储节点1发生故障,此时系统进入异常场景,并将虚拟IP切换到其他正常的存储节点(图2中的存储节点3)。
本申请实施例提供的分布式块存储管理系统,包括:分布式块存储集群、客户端和多个存储节点,每个存储节点上均设有任务分发器;客户端用于获取用户输入的分布式块存储管理请求,并将分布式块管理请求发送到绑定有虚拟IP的目标存储节点,目标存储节点根据分布式块管理请求,对分布式块存储集群进行管理操作;目标存储节点上的任务分发器用于监测目标存储节点是否故障,若是,则重新确定目标存储节点,并将虚拟IP切换到新的目标存储节点;分布式块存储集群基于虚拟IP,将管理结果发送到新的目标存储节点,以基于新的目标存储节点,将管理结果反馈到客户端。上述方案提供的系统,通过在原始的目标存储节点发生故障时,将虚拟IP切换到其他正常存储节点上,使此时的分布式块存储集群能够基于其他正常的存储节点上报管理结果,提高了分布式块存储管理效率。并且,实现了分布式块存储管理系统的快速故障切换,能够提高分布式块存储管理系统的可靠性和故障切换的速度,同时提高了故障场景下分布式块存储管理系统的指令处理速度。
本申请实施例提供了一种分布式块存储管理方法,用于管理分布式块存储集群。本申请实施例的执行主体为电子设备,比如服务器、台式电脑、笔记本电脑、平板电脑及其他可用于管理分布式块存储集群的电子设备,具体可以为上述实施例提供的分布式块存储管理系统中的任务分发器。
如图3所示,为本申请实施例提供的分布式块存储管理方法的流程示意图,该方法包括:
步骤301,获取用户输入的分布式块存储管理请求,并将分布式块管理请求发送到绑定有虚拟IP的目标存储节点;
步骤302,基于目标存储节点根据分布式块管理请求,对分布式块存储集群进行管理操作;
步骤303,监测目标存储节点是否故障,若是,则重新确定目标存储节点,并将虚拟IP切换到新的目标存储节点;
步骤304,控制分布式块存储集群基于虚拟IP,将管理结果发送到新的目标存储节点,以基于新的目标存储节点,向上层反馈管理结果。
具体地,在一实施例中,监测目标存储节点是否故障,包括:
按照预设周期,向目标存储节点发送心跳信号;
根据目标存储节点对心跳信号的反馈情况,判断目标存储节点是否故障。
具体地,在一实施例中,该方法还包括:
步骤401,获取其他存储节点故障监测结果。
具体地,在一实施例中,重新确定目标存储节点,包括:
根据其他存储节点故障监测结果,确定正常存储节点;
当目标存储节点发生故障时,将任一正常存储节点确定为新的目标存储节点。
具体地,在一实施例中,存储节点包括RBD客户端。
需要说明的是,任务分发器包括RBD客户端,而任务分发器设置在存储节点上,因此可以确定存储节点包括RBD客户端。
具体地,在一实施例中,监测目标存储节点是否故障,包括:
监测目标存储节点与RBD客户端之间的连接是否异常;
当目标存储节点与RBD客户端之间的连接异常时,确定目标存储节点发生故障。
关于本实施例中的分布式块存储管理方法,其中各个步骤的具体实施方式已经在有关该系统的实施例中进行了详细描述,此处将不做详细阐述说明。
本申请实施例提供的分布式块存储管理方法,通过获取用户输入的分布式块存储管理请求,并将分布式块管理请求发送到绑定有虚拟IP的目标存储节点;基于目标存储节点根据分布式块管理请求,对分布式块存储集群进行管理操作;监测目标存储节点是否故障,若是,则重新确定目标存储节点,并将虚拟IP切换到新的目标存储节点;控制分布式块存储集群基于虚拟IP,将管理结果发送到新的目标存储节点,以基于新的目标存储节点,向上层反馈管理结果。上述方案提供的方法,通过在原始的目标存储节点发生故障时,将虚拟IP切换到其他正常存储节点上,使此时的分布式块存储集群能够基于其他正常的存储节点上报管理结果,提高了分布式块存储管理效率。并且,实现了分布式块存储管理系统的快速故障切换,能够提高分布式块存储管理系统的可靠性和故障切换的速度,同时提高了故障场景下分布式块存储管理系统的指令处理速度。
本申请实施例提供了一种电子设备,用于执行上述实施例提供的分布式块存储管理方法。
如图4所示,为本申请实施例提供的电子设备的结构示意图。该电子设备40包括:至少一个处理器41和存储器42。
存储器存储计算机执行指令;至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如上实施例提供的分布式块存储管理方法。
本申请实施例提供的一种电子设备,用于执行上述实施例提供的分布式块存储管理方法,其实现方式与原理相同,不再赘述。
本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上任一实施例提供的分布式块存储管理方法。
本申请实施例的包含计算机可执行指令的存储介质,可用于存储前述实施例中提供的分布式块存储管理方法的计算机执行指令,其实现方式与原理相同,不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (8)

1.一种分布式块存储管理系统,其特征在于,包括:分布式块存储集群、客户端和多个存储节点,每个存储节点上均设有任务分发器;
所述客户端用于获取用户输入的分布式块存储管理请求,并将所述分布式块管理请求发送到绑定有虚拟IP的目标存储节点;
所述目标存储节点根据所述分布式块管理请求,对分布式块存储集群进行管理操作;
所述目标存储节点上的任务分发器用于监测所述目标存储节点是否故障,若是,则重新确定目标存储节点,并将所述虚拟IP切换到新的目标存储节点;
所述分布式块存储集群基于所述虚拟IP,将管理结果发送到所述新的目标存储节点,以基于所述新的目标存储节点,将所述管理结果反馈到所述客户端;
所述任务分发器包括RBD客户端;
所述目标存储节点上的任务分发器,具体用于:
监测所述目标存储节点与所述RBD客户端之间的连接是否异常;
当所述目标存储节点与所述RBD客户端之间的连接异常时,确定所述目标存储节点发生故障。
2.根据权利要求1所述的系统,其特征在于,所述任务分发器,具体用于:
按照预设周期,向所属的存储节点发送心跳信号;
根据所述存储节点对所述心跳信号的反馈情况,判断所述存储节点是否故障。
3.根据权利要求1所述的系统,其特征在于,各所述任务分发器之间设有通信连接。
4.根据权利要求3所述的系统,其特征在于,所述目标存储节点上的任务分发器,还用于:
基于所述各所述任务分发器之间设有通信连接,获取其他任务分发器的存储节点故障监测结果。
5.根据权利要求4所述的系统,其特征在于,所述目标存储节点上的任务分发器,具体用于:
根据所述其他任务分发器的存储节点故障监测结果,确定正常存储节点;
当所述目标存储节点发生故障时,将任一所述正常存储节点确定为新的目标存储节点。
6.一种分布式块存储管理方法,其特征在于,包括:
获取用户输入的分布式块存储管理请求,并将所述分布式块管理请求发送到绑定有虚拟IP的目标存储节点;
基于所述目标存储节点根据所述分布式块管理请求,对分布式块存储集群进行管理操作;
监测所述目标存储节点是否故障,若是,则重新确定目标存储节点,并将所述虚拟IP切换到新的目标存储节点;
控制所述分布式块存储集群基于所述虚拟IP,将管理结果发送到所述新的目标存储节点,以基于所述新的目标存储节点,向上层反馈所述管理结果;
所述存储节点包括RBD客户端;
可选的,所述监测所述目标存储节点是否故障,包括:
监测所述目标存储节点与所述RBD客户端之间的连接是否异常;
当所述目标存储节点与所述RBD客户端之间的连接异常时,确定所述目标存储节点发生故障。
7.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求6所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求6所述的方法。
CN202210151978.2A 2022-02-18 2022-02-18 一种分布式块存储管理系统、方法及电子设备 Active CN114553900B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210151978.2A CN114553900B (zh) 2022-02-18 2022-02-18 一种分布式块存储管理系统、方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210151978.2A CN114553900B (zh) 2022-02-18 2022-02-18 一种分布式块存储管理系统、方法及电子设备

Publications (2)

Publication Number Publication Date
CN114553900A CN114553900A (zh) 2022-05-27
CN114553900B true CN114553900B (zh) 2023-08-04

Family

ID=81675047

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210151978.2A Active CN114553900B (zh) 2022-02-18 2022-02-18 一种分布式块存储管理系统、方法及电子设备

Country Status (1)

Country Link
CN (1) CN114553900B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109032830A (zh) * 2018-07-25 2018-12-18 广东浪潮大数据研究有限公司 一种分布式存储系统的故障恢复方法、系统及相关组件
CN109040212A (zh) * 2018-07-24 2018-12-18 苏州科达科技股份有限公司 设备接入服务器集群方法、系统、设备及存储介质
CN110740167A (zh) * 2019-09-20 2020-01-31 北京浪潮数据技术有限公司 一种分布式存储系统及其节点监控方法
CN111431980A (zh) * 2020-03-17 2020-07-17 星辰天合(北京)数据科技有限公司 分布式存储系统及其路径切换方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109040212A (zh) * 2018-07-24 2018-12-18 苏州科达科技股份有限公司 设备接入服务器集群方法、系统、设备及存储介质
CN109032830A (zh) * 2018-07-25 2018-12-18 广东浪潮大数据研究有限公司 一种分布式存储系统的故障恢复方法、系统及相关组件
CN110740167A (zh) * 2019-09-20 2020-01-31 北京浪潮数据技术有限公司 一种分布式存储系统及其节点监控方法
CN111431980A (zh) * 2020-03-17 2020-07-17 星辰天合(北京)数据科技有限公司 分布式存储系统及其路径切换方法

Also Published As

Publication number Publication date
CN114553900A (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
US9141491B2 (en) Highly available server system based on cloud computing
US11075795B2 (en) Arbitration method, apparatus, and system used in active-active data centers
US6839752B1 (en) Group data sharing during membership change in clustered computer system
CN106302565B (zh) 业务服务器的调度方法及系统
US20220269564A1 (en) Processing node management method, configuration method, and related apparatus
CN106330475B (zh) 一种通信系统中管理主备节点的方法和装置及高可用集群
CN105141400A (zh) 一种高可用性集群管理方法及相关设备
CN107395458B (zh) 系统监控方法及装置
KR101211207B1 (ko) 캐시 클라우드 구조를 이용한 캐시 시스템 및 캐싱 서비스 제공 방법
CN102567227A (zh) 共享缓存设备的双控制器存储系统和方法
WO2020252724A1 (zh) 日志处理方法、设备及计算机可读存储介质
CN111541762A (zh) 数据处理的方法、管理服务器、设备及存储介质
CN113515408A (zh) 一种数据容灾方法、装置、设备及介质
CN114553900B (zh) 一种分布式块存储管理系统、方法及电子设备
CN110034951A (zh) iSCSI目标器的故障切换方法及iSCSI主目标器
JP5529596B2 (ja) 処理方法、処理装置、通信装置及びプログラム
CN115145782A (zh) 一种服务器切换方法,MooseFS系统及存储介质
CN105591780B (zh) 集群监测方法和设备
JP2000132519A (ja) 分散シミュレーションシステム
EP4057582B1 (en) Device management method and apparatus
CN115378557B (zh) 热备实现方法、装置、系统、电子设备及存储介质
CN108959170B (zh) 虚拟设备管理方法、装置、堆叠系统及可读存储介质
KR101076762B1 (ko) 프로세스 할당 장치 및 그 동작 방법
CN208299812U (zh) 一种基于ZooKeeper集群的主备切换系统
CN108270598B (zh) 一种分布式系统容灾方法、装置和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant