CN108776579B - 一种分布式存储集群扩容方法、装置、设备及存储介质 - Google Patents

一种分布式存储集群扩容方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN108776579B
CN108776579B CN201810628777.0A CN201810628777A CN108776579B CN 108776579 B CN108776579 B CN 108776579B CN 201810628777 A CN201810628777 A CN 201810628777A CN 108776579 B CN108776579 B CN 108776579B
Authority
CN
China
Prior art keywords
node
system disk
added
distributed storage
disk fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810628777.0A
Other languages
English (en)
Other versions
CN108776579A (zh
Inventor
史宗华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810628777.0A priority Critical patent/CN108776579B/zh
Publication of CN108776579A publication Critical patent/CN108776579A/zh
Application granted granted Critical
Publication of CN108776579B publication Critical patent/CN108776579B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种分布式存储集群扩容方法,该方法包括以下步骤:在要对分布式存储集群进行扩容时,确定待加入存储节点是否为系统盘故障恢复节点;如果是,则在清理待加入存储节点中的分区残留信息后,为待加入存储节点的每块磁盘创建数据处理守护进程;在分布式存储集群的主节点的监控服务中为每个数据处理守护进程注册监控信息。应用本发明实施例所提供的技术方案,对分布式存储集群进行有效扩容,实现对系统盘故障恢复节点的再利用,节约硬件成本,降低了存储节点系统盘故障对分布式存储集群造成的影响,增强了分布式存储集群存储性能。本发明还公开了一种分布式存储集群扩容装置、设备及存储介质,具有相应技术效果。

Description

一种分布式存储集群扩容方法、装置、设备及存储介质
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种分布式存储集群扩容方法、装置、设备及存储介质。
背景技术
随着计算机技术的快速发展,分布式存储集群在各个行业得到了越来越广泛的应用。分布式存储集群由主节点和多个存储节点构成,多用于大数据的存储,主节点可以对各个存储节点进行监控和管理。
随着分布式存储集群的持续使用,可能会出现存储节点发生故障的情况。存储节点一旦发生故障将会无法继续工作,需要从分布式存储集群中去除。但随着分布式存储集群中存储数据量的不断增加,其剩余的存储空间会越来越少。在这种情况下,需要考虑对分布式存储集群的扩容问题。
而为了更好的节约硬件成本,如何利用之前发生故障的存储节点对分布式存储集群进行扩容,是目前本领域技术人员急需解决的技术问题。
发明内容
本发明的目的是提供一种分布式存储集群扩容方法、装置、设备及存储介质,以对分布式存储集群进行有效扩容,节约硬件成本,增强分布式存储集群存储性能。
为解决上述技术问题,本发明提供如下技术方案:
一种分布式存储集群扩容方法,包括:
在要对分布式存储集群进行扩容时,确定待加入存储节点是否为系统盘故障恢复节点;
如果是,则在清理所述待加入存储节点中的分区残留信息后,为所述待加入存储节点的每块磁盘创建数据处理守护进程;
在所述分布式存储集群的主节点的监控服务中为每个所述数据处理守护进程注册监控信息。
在本发明的一种具体实施方式中,还包括:
在所述分布式存储集群中存在系统盘故障节点的情况下,删除所述主节点的监控服务中所述系统盘故障节点对应的监控信息;
在确定对所述系统盘故障节点进行系统灌装、可达之后,将所述系统盘故障节点确定为系统盘故障恢复节点。
在本发明的一种具体实施方式中,在所述分布式存储集群中存在系统盘故障节点的情况下,还包括:
确定所述系统盘故障节点的标识信息;
在所述主节点的缩容信息中增加所述系统盘故障节点的标识信息;
相应的,所述确定待加入存储节点是否为系统盘故障恢复节点,包括:
在所述缩容信息中查询所述待加入存储节点的标识信息;
如果查询到,则确定所述待加入存储节点为系统盘故障恢复节点。
在本发明的一种具体实施方式中,所述确定所述系统盘故障节点的标识信息,包括:
确定所述系统盘故障节点的主机名;
根据所述主机名和所述主节点中预先记录的主机名与标识信息的对应关系,确定所述系统盘故障节点的标识信息。
在本发明的一种具体实施方式中,还包括:
在所述待加入存储节点为全新存储节点时,执行所述为所述待加入存储节点的每块磁盘创建数据处理守护进程;在所述分布式存储集群的主节点的监控服务中为每个所述数据处理守护进程注册监控信息的步骤。
一种分布式存储集群扩容装置,包括:
第一节点确定模块,用于在要对分布式存储集群进行扩容时,确定待加入存储节点是否为系统盘故障恢复节点;如果是,则触发进程创建模块;
所述进程创建模块,用于在清理所述待加入存储节点中的分区残留信息后,为所述待加入存储节点的每块磁盘创建数据处理守护进程;
信息注册模块,用于在所述分布式存储集群的主节点的监控服务中为每个所述数据处理守护进程注册监控信息。
在本发明的一种具体实施方式中,还包括:
信息删除模块,用于在所述分布式存储集群中存在系统盘故障节点的情况下,删除所述主节点的监控服务中所述系统盘故障节点对应的监控信息;
第二节点确定模块,用于在确定对所述系统盘故障节点进行系统灌装、可达之后,将所述系统盘故障节点确定为系统盘故障恢复节点。
在本发明的一种具体实施方式中,还包括信息增加模块,用于:
在所述分布式存储集群中存在系统盘故障节点的情况下,确定所述系统盘故障节点的标识信息;
在所述主节点的缩容信息中增加所述系统盘故障节点的标识信息;
相应的,所述第一节点确定模块,具体用于:
在所述缩容信息中查询所述待加入存储节点的标识信息;
如果查询到,则确定所述待加入存储节点为系统盘故障恢复节点。
一种分布式存储集群扩容设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述任一项所述分布式存储集群扩容方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述分布式存储集群扩容方法的步骤。
应用本发明实施例所提供的技术方案,在要对分布式存储集群进行扩容时,可以先确定待加入存储节点是否为系统盘故障恢复节点,如果是,则清理待加入存储节点中的分区残留信息,清理之后,为待加入存储节点的每块磁盘创建数据处理守护进程,在分布式存储集群的主节点的监控服务中为每个数据处理守护进程注册监控信息。将系统盘故障恢复节点加入到分布式存储集群中,对分布式存储集群进行有效扩容,实现对系统盘故障恢复节点的再利用,节约硬件成本,降低了存储节点系统盘故障对分布式存储集群造成的影响,增强了分布式存储集群存储性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种分布式存储集群扩容方法的实施流程图;
图2为本发明实施例中一种分布式存储集群扩容装置的结构示意图;
图3为本发明实施例中一种分布式存储集群扩容设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1所示,为本发明所提供的一种分布式存储集群扩容方法的实施流程图,该方法可以包括以下步骤:
S110:在要对分布式存储集群进行扩容时,确定待加入存储节点是否为系统盘故障恢复节点。
分布式存储集群包括主节点和多个存储节点,主要用于大数据的存储,主节点可以对各个存储节点进行监控和管理。
随着分布式存储集群的持续使用,其中的存储节点可能会出现系统盘故障的情况。具体的,可以通过尝试硬重启(下电等待数秒后重新上电)发生故障的存储节点,如果该存储节点未有硬件故障灯亮起,但系统仍然无法启动,则可以确定该存储节点发生系统盘故障。
当存储节点出现系统盘故障时,将无法继续工作,为不影响分布式存储集群的正常工作,需要将这样的存储节点从分布式存储集群中去除,对分布式存储集群进行缩容操作。这样的存储节点可以称为系统盘故障节点。
在本发明的一个实施例中,在分布式存储集群中存在系统盘故障节点的情况下,可以删除主节点的监控服务中系统盘故障节点对应的监控信息,在确定对系统盘故障节点进行系统灌装、可达之后,将系统盘故障节点确定为系统盘故障恢复节点。
在分布式存储集群中,如果存储节点发生系统盘故障,将不可达,其上的数据处理守护进程将停止工作,使得该存储节点无法继续完成分布式存储集群中的存储等相应工作,影响分布式存储集群的正常工作。在分布式存储集群中存在系统盘故障节点的情况下,可以先删除主节点的监控服务中系统盘故障节点对应的监控信息,即从主节点的监控服务中清理掉系统盘故障节点上数据处理守护进程的监控信息,对分布式存储集群进行缩容操作,以便缩容后的分布式存储集群还可以继续工作。
对于系统盘故障节点,具体可以由技术人员对其进行系统盘更换、系统灌装。在对系统盘故障节点进行系统灌装后,可以进一步确定该系统盘故障节点是否可达。具体的,可以通过主节点或其他设备向系统盘故障节点发送数据包,如果能够接收到系统盘故障节点返回的数据包,则可以确定系统盘故障节点可达。
在确定对系统盘故障节点进行系统灌装、可达之后,可以将系统盘故障节点确定为系统盘故障恢复节点。
当系统盘故障节点恢复后,成为系统盘故障恢复节点,还可以加入到分布式存储集群中,对分布式存储集群进行扩容操作。
在要对分布式存储集群进行扩容时,可以确定待加入存储节点是否为系统盘故障恢复节点,如果是,则可以继续执行步骤S120的操作,如果否,则可以根据待加入存储节点的具体情况进行相应扩容操作。
S120:在清理待加入存储节点中的分区残留信息后,为待加入存储节点的每块磁盘创建数据处理守护进程。
在待加入存储节点为系统盘故障节点的情况下,待加入节点中会残留有故障前数据处理守护进程残留的分区等信息。为防止干扰正常扩容流程,可以先清理待加入存储节点中的分区残留信息。清理后,为待加入存储节点的每块磁盘创建数据处理守护进程。
S130:在分布式存储集群的主节点的监控服务中为每个数据处理守护进程注册监控信息。
待加入存储节点为系统盘故障恢复节点,在清理掉其中的分区残留信息后,为其每块磁盘创建数据处理守护进程。每块磁盘对应一个数据处理守护进程。在分布式存储集群的主节点的监控服务中为每个数据处理守护进程注册监控信息。
在待加入存储节点为全新存储节点时,可以直接进行为待加入存储节点的每块磁盘创建数据处理守护进程,在分布式存储集群的主节点的监控服务中为每个数据处理守护进程注册监控信息的操作。全新存储节点不是因故障从分布式存储集群中去除的节点,而是具有全新系统,未残留有任何分区信息的节点。
需要说明的是,针对每一个待加入存储节点都可以进行上述操作,以完成对分布式存储集群的扩容操作。
在主节点的监控服务中为待加入存储节点的每个数据处理守护进程注册监控信息后,主节点可以对该存储节点进行监控和管理,该存储节点可以开始工作。等待扩容后的分布式存储集群数据均衡后,恢复到正常状态。
应用本发明实施例所提供的方法,在要对分布式存储集群进行扩容时,可以先确定待加入存储节点是否为系统盘故障恢复节点,如果是,则清理待加入存储节点中的分区残留信息,清理之后,为待加入存储节点的每块磁盘创建数据处理守护进程,在分布式存储集群的主节点的监控服务中为每个数据处理守护进程注册监控信息。将系统盘故障恢复节点加入到分布式存储集群中,对分布式存储集群进行有效扩容,实现对系统盘故障恢复节点的再利用,节约硬件成本,降低了存储节点系统盘故障对分布式存储集群造成的影响,增强了分布式存储集群存储性能。
在本发明的一个实施例中,在分布式存储集群中存在系统盘故障节点的情况下,还可以包括以下步骤:
步骤一:确定系统盘故障节点的标识信息;
步骤二:在主节点的缩容信息中增加系统盘故障节点的标识信息;
相应的,步骤S110可以包括以下步骤:
第一个步骤:在缩容信息中查询待加入存储节点的标识信息;如果查询到,则执行第二个步骤;
第二个步骤:确定待加入存储节点为系统盘故障恢复节点。
为便于描述,将上述几个步骤结合起来进行描述。
在本发明实施例中,在分布式存储集群中存在系统盘故障节点的情况下,可以先确定系统盘故障节点的标识信息,如设备序列号等信息。在将系统盘故障节点在分布式存储集群中去除,对分布式存储集群进行缩容操作时,可以在主节点的缩容信息中增加系统盘故障节点的标识信息,这样可以避免其他存储节点以系统盘故障节点的节点名或IP等进行扩容,造成误判。
具体的,可以通过以下步骤确定系统盘故障节点的标识信息:
确定系统盘故障节点的主机名;
根据主机名和主节点中预先记录的主机名与标识信息的对应关系,确定系统盘故障节点的标识信息。
在实际应用中,当一个存储节点发生系统盘故障时,已不可达,较难在该存储节点中查询到其设备序列号等标识信息。所以,在分布式存储集群部署时,可以在主节点中预先记录各个存储节点主机名与标识信息的对应关系,这样,当需要在主节点的缩容信息中增加系统盘故障节点的标识信息时,可以通过系统盘故障节点的主机名和主节点中预先记录的主机名与标识信息的对应关系,确定系统盘故障节点的标识信息。
在要对分布式存储集群进行扩容时,可以先在缩容信息中查询待加入存储节点的标识信息,如果查询到,则表明待加入存储节点是之前因系统盘故障被缩容的一个节点,当前已被恢复,从而可以确定待加入存储节点为系统盘故障恢复节点。
相应于上面的方法实施例,本发明实施例还提供了一种分布式存储集群扩容装置,下文描述的一种分布式存储集群扩容装置与上文描述的一种分布式存储集群扩容方法可相互对应参照。
参见图2所示,该装置包括以下模块:
第一节点确定模块210,用于在要对分布式存储集群进行扩容时,确定待加入存储节点是否为系统盘故障恢复节点;如果是,则触发进程创建模块220;
进程创建模块220,用于在清理待加入存储节点中的分区残留信息后,为待加入存储节点的每块磁盘创建数据处理守护进程;
信息注册模块230,用于在分布式存储集群的主节点的监控服务中为每个数据处理守护进程注册监控信息。
应用本发明实施例所提供的装置,在要对分布式存储集群进行扩容时,可以先确定待加入存储节点是否为系统盘故障恢复节点,如果是,则清理待加入存储节点中的分区残留信息,清理之后,为待加入存储节点的每块磁盘创建数据处理守护进程,在分布式存储集群的主节点的监控服务中为每个数据处理守护进程注册监控信息。将系统盘故障恢复节点加入到分布式存储集群中,对分布式存储集群进行有效扩容,实现对系统盘故障恢复节点的再利用,节约硬件成本,降低了存储节点系统盘故障对分布式存储集群造成的影响,增强了分布式存储集群存储性能。
在本发明的一种具体实施方式中,还包括:
信息删除模块,用于在分布式存储集群中存在系统盘故障节点的情况下,删除主节点的监控服务中系统盘故障节点对应的监控信息;
第二节点确定模块,用于在确定对系统盘故障节点进行系统灌装、可达之后,将系统盘故障节点确定为系统盘故障恢复节点。
在本发明的一种具体实施方式中,还包括信息增加模块,用于:
在分布式存储集群中存在系统盘故障节点的情况下,确定系统盘故障节点的标识信息;
在主节点的缩容信息中增加系统盘故障节点的标识信息;
相应的,第一节点确定模块,具体用于:
在缩容信息中查询待加入存储节点的标识信息;
如果查询到,则确定待加入存储节点为系统盘故障恢复节点。
在本发明的一种具体实施方式中,信息增加模块,具体用于:
确定系统盘故障节点的主机名;
根据主机名和主节点中预先记录的主机名与标识信息的对应关系,确定系统盘故障节点的标识信息。
在本发明的一种具体实施方式中,还包括执行模块,用于:
在待加入存储节点为全新存储节点时,执行为待加入存储节点的每块磁盘创建数据处理守护进程;在分布式存储集群的主节点的监控服务中为每个数据处理守护进程注册监控信息的步骤。
参见图3所示,相应于上面的方法实施例,本发明实施例还提供了一种分布式存储集群扩容设备,包括:
存储器310,用于存储计算机程序;
处理器320,用于执行计算机程序时实现上述分布式存储集群扩容方法的步骤。
相应于上面的方法实施例,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述分布式存储集群扩容方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (8)

1.一种分布式存储集群扩容方法,其特征在于,包括:
在要对分布式存储集群进行扩容时,确定待加入存储节点是否为系统盘故障恢复节点;
如果是,则在清理所述待加入存储节点中的分区残留信息后,为所述待加入存储节点的每块磁盘创建数据处理守护进程;
在所述分布式存储集群的主节点的监控服务中为每个所述数据处理守护进程注册监控信息;
其中,在所述分布式存储集群中存在系统盘故障节点的情况下,还包括:
确定所述系统盘故障节点的标识信息;
在所述主节点的缩容信息中增加所述系统盘故障节点的标识信息,以避免其他存储节点以所述系统盘故障节点的节点名或IP进行扩容;
所述确定待加入存储节点是否为系统盘故障恢复节点,包括:
在所述缩容信息中查询所述待加入存储节点的标识信息;
如果查询到,则确定所述待加入存储节点为系统盘故障恢复节点。
2.根据权利要求1所述的方法,其特征在于,还包括:
在所述分布式存储集群中存在系统盘故障节点的情况下,删除所述主节点的监控服务中所述系统盘故障节点对应的监控信息;
在确定对所述系统盘故障节点进行系统灌装、可达之后,将所述系统盘故障节点确定为系统盘故障恢复节点。
3.根据权利要求1所述的方法,其特征在于,所述确定所述系统盘故障节点的标识信息,包括:
确定所述系统盘故障节点的主机名;
根据所述主机名和所述主节点中预先记录的主机名与标识信息的对应关系,确定所述系统盘故障节点的标识信息。
4.根据权利要求1至3之中任一项所述的方法,其特征在于,还包括:
在所述待加入存储节点为全新存储节点时,执行所述为所述待加入存储节点的每块磁盘创建数据处理守护进程;在所述分布式存储集群的主节点的监控服务中为每个所述数据处理守护进程注册监控信息的步骤。
5.一种分布式存储集群扩容装置,其特征在于,包括:
第一节点确定模块,用于在要对分布式存储集群进行扩容时,确定待加入存储节点是否为系统盘故障恢复节点;如果是,则触发进程创建模块;
所述进程创建模块,用于在清理所述待加入存储节点中的分区残留信息后,为所述待加入存储节点的每块磁盘创建数据处理守护进程;
信息注册模块,用于在所述分布式存储集群的主节点的监控服务中为每个所述数据处理守护进程注册监控信息;
信息增加模块,用于在所述分布式存储集群中存在系统盘故障节点的情况下,确定所述系统盘故障节点的标识信息;在所述主节点的缩容信息中增加所述系统盘故障节点的标识信息,以避免其他存储节点以所述系统盘故障节点的节点名或IP进行扩容;
所述第一节点确定模块,具体用于在所述缩容信息中查询所述待加入存储节点的标识信息;如果查询到,则确定所述待加入存储节点为系统盘故障恢复节点。
6.根据权利要求5所述的装置,其特征在于,还包括:
信息删除模块,用于在所述分布式存储集群中存在系统盘故障节点的情况下,删除所述主节点的监控服务中所述系统盘故障节点对应的监控信息;
第二节点确定模块,用于在确定对所述系统盘故障节点进行系统灌装、可达之后,将所述系统盘故障节点确定为系统盘故障恢复节点。
7.一种分布式存储集群扩容设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述分布式存储集群扩容方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述分布式存储集群扩容方法的步骤。
CN201810628777.0A 2018-06-19 2018-06-19 一种分布式存储集群扩容方法、装置、设备及存储介质 Active CN108776579B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810628777.0A CN108776579B (zh) 2018-06-19 2018-06-19 一种分布式存储集群扩容方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810628777.0A CN108776579B (zh) 2018-06-19 2018-06-19 一种分布式存储集群扩容方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN108776579A CN108776579A (zh) 2018-11-09
CN108776579B true CN108776579B (zh) 2021-10-15

Family

ID=64026164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810628777.0A Active CN108776579B (zh) 2018-06-19 2018-06-19 一种分布式存储集群扩容方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN108776579B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109669642B (zh) * 2018-12-24 2022-06-10 广东浪潮大数据研究有限公司 存储系统的节点加入方法、系统、装置及可读存储介质
CN110781164B (zh) * 2019-09-29 2022-07-05 苏州浪潮智能科技有限公司 一种数据库一体机的设计方法、设备及介质
CN111339055B (zh) * 2020-02-07 2023-08-01 浪潮软件股份有限公司 大数据集群扩容方法及装置
CN111966609B (zh) * 2020-07-29 2022-12-16 苏州浪潮智能科技有限公司 一种ssd缓存分区创建的方法、系统、设备、产品
CN114168071B (zh) * 2021-10-29 2023-11-03 济南浪潮数据技术有限公司 一种分布式集群扩容方法、分布式集群扩容装置及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102932210A (zh) * 2012-11-23 2013-02-13 北京搜狐新媒体信息技术有限公司 一种PaaS云平台的节点监控方法和系统
WO2013091212A1 (zh) * 2011-12-22 2013-06-27 华为技术有限公司 一种分布式存储系统中分区管理方法、设备及系统
CN103259688A (zh) * 2013-06-04 2013-08-21 北京搜狐新媒体信息技术有限公司 一种分布式存储系统的故障诊断方法与装置
CN103617276A (zh) * 2013-12-09 2014-03-05 南京大学 一种分布式层次化的rdf数据的存储方法
CN104410547A (zh) * 2014-12-03 2015-03-11 合肥工大高科信息科技股份有限公司 一种分布式控制系统中的地址冲突检测方法
CN105159818A (zh) * 2015-08-28 2015-12-16 东北大学 内存数据管理中日志恢复方法及其仿真系统
CN107204868A (zh) * 2016-03-18 2017-09-26 中国移动通信集团山西有限公司 一种任务运行监控信息获取方法和装置
CN107273231A (zh) * 2016-04-07 2017-10-20 阿里巴巴集团控股有限公司 分布式存储系统硬盘挂住故障检测、处理方法及装置
CN107608826A (zh) * 2017-09-19 2018-01-19 郑州云海信息技术有限公司 一种存储集群的节点的故障恢复方法、装置及介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013091212A1 (zh) * 2011-12-22 2013-06-27 华为技术有限公司 一种分布式存储系统中分区管理方法、设备及系统
CN102932210A (zh) * 2012-11-23 2013-02-13 北京搜狐新媒体信息技术有限公司 一种PaaS云平台的节点监控方法和系统
CN103259688A (zh) * 2013-06-04 2013-08-21 北京搜狐新媒体信息技术有限公司 一种分布式存储系统的故障诊断方法与装置
CN103617276A (zh) * 2013-12-09 2014-03-05 南京大学 一种分布式层次化的rdf数据的存储方法
CN104410547A (zh) * 2014-12-03 2015-03-11 合肥工大高科信息科技股份有限公司 一种分布式控制系统中的地址冲突检测方法
CN105159818A (zh) * 2015-08-28 2015-12-16 东北大学 内存数据管理中日志恢复方法及其仿真系统
CN107204868A (zh) * 2016-03-18 2017-09-26 中国移动通信集团山西有限公司 一种任务运行监控信息获取方法和装置
CN107273231A (zh) * 2016-04-07 2017-10-20 阿里巴巴集团控股有限公司 分布式存储系统硬盘挂住故障检测、处理方法及装置
CN107608826A (zh) * 2017-09-19 2018-01-19 郑州云海信息技术有限公司 一种存储集群的节点的故障恢复方法、装置及介质

Also Published As

Publication number Publication date
CN108776579A (zh) 2018-11-09

Similar Documents

Publication Publication Date Title
CN108776579B (zh) 一种分布式存储集群扩容方法、装置、设备及存储介质
CN108847982B (zh) 一种分布式存储集群及其节点故障切换方法和装置
CN107729185B (zh) 一种故障处理方法及装置
CN105208124A (zh) 管理锁的方法及装置、确定锁管理服务器的方法及装置
CN106911728A (zh) 分布式系统中主节点的选取方法和装置
CN109391691B (zh) 一种单节点故障下nas服务的恢复方法及相关装置
CN109213637B (zh) 分布式文件系统集群节点的数据恢复方法、装置及介质
CN112769652B (zh) 一种节点服务监控方法、装置、设备及介质
CN112506702A (zh) 数据中心容灾方法、装置、设备及存储介质
CN104486125A (zh) 配置文件的备份方法及装置
CN106331081B (zh) 一种信息同步方法及装置
CN110933142A (zh) 一种icfs集群网卡监控方法、装置和设备及介质
CN111752488B (zh) 存储集群的管理方法、装置、管理节点及存储介质
CN113438292A (zh) 一种基于自动化运维工具的代理部署方法及装置
CN110290002B (zh) 一种更新方法、终端及电子设备
JP6421516B2 (ja) サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法
CN111541591B (zh) 一种基于ssh对服务器进行检测的方法和装置
CN112738295B (zh) Ip地址异常处理方法、装置、计算机系统和存储介质
CN111880992B (zh) 一种存储设备中控制器状态的监测及维护方法
CN115314361B (zh) 一种服务器集群管理方法及其相关组件
CN111338858A (zh) 一种双机房的容灾方法及装置
CN112491633B (zh) 一种多节点集群的故障恢复方法、系统及相关组件
CN112612652A (zh) 分布式存储系统异常节点重启方法及系统
CN116931814A (zh) 一种云硬盘扩容的方法、装置、电子设备及存储介质
CN112068935A (zh) kubernetes程序部署监控方法、装置以及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant