CN105335251A - 一种故障恢复方法及系统 - Google Patents

一种故障恢复方法及系统 Download PDF

Info

Publication number
CN105335251A
CN105335251A CN201510612302.9A CN201510612302A CN105335251A CN 105335251 A CN105335251 A CN 105335251A CN 201510612302 A CN201510612302 A CN 201510612302A CN 105335251 A CN105335251 A CN 105335251A
Authority
CN
China
Prior art keywords
memory node
node
storage
memory
failed storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510612302.9A
Other languages
English (en)
Other versions
CN105335251B (zh
Inventor
毕敬强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201510612302.9A priority Critical patent/CN105335251B/zh
Publication of CN105335251A publication Critical patent/CN105335251A/zh
Application granted granted Critical
Publication of CN105335251B publication Critical patent/CN105335251B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本发明公开了一种故障恢复方法及系统,应用于预先建立的存储系统,该存储系统包括至少一个存储节点组,每个存储节点组均包括M个执行存储工作的第一存储节点及N个未执行存储工作的第二存储节点,M和N均为正整数;该方法包括:当任一第一存储节点发生故障时,确定发生故障的第一存储节点为故障存储节点,故障存储节点对应的存储节点组为故障存储节点组;按照预设原则选取故障存储节点组中的一个第二存储节点为替补存储节点;利用替补存储节点取代故障存储节点,并完成故障存储节点需执行的存储工作。由此,减少了运维的工作量,减少了系统故障的恢复时间和迁移的数据量,降低了系统恢复带来的风险。

Description

一种故障恢复方法及系统
技术领域
本发明涉及计算机技术领域,更具体地说,涉及一种故障恢复方法及系统。
背景技术
随着互联网时代的到来,微博、微信、网购等面向普通互联网用户的网站正在蓬勃兴起,互联网界的巨头公司向数以亿计的用户提供着基于互联网的各种服务。遍布世界各地的互联网用户每天都在网上发布信息,他们产生的这些信息数据是个人计算机的数据量的数倍。
为了随时应对激增的用户请求,越来越多的公司采用分布式存储系统。分布式存储系统具有高可靠性、高可用性和高扩展性,可以将分布在各处的资源综合利用,同时可以将负载由单个存储节点转移到多个,从而提高了存储系统的性能。
在分布式存储系统中,数据的冗余机制和系统的自我修复能够在任一存储节点发生故障时,一定程度上保证分布式存储系统中数据的可靠性,但是,其仍然存在一定的弊端。以存储节点为硬盘为例,对数据的冗余机制和系统的自我修复的弊端进行具体说明:一方面是当任一硬盘出现故障时,一般会启动缩容,即减少存储节点并根据一致性哈希算法进行数据迁移,由于硬盘容量一般都是TB级别,同时网卡的带宽和硬盘读写速度存在瓶颈,所以系统的恢复时间比较长;另一方面,系统自动缩容并恢复后,为了保证系统的容量满足业务需求,运维人员还需要将故障硬盘换下,然后在故障硬盘的盘位换上新硬盘,这又会导致新的数据迁移,即扩容。
综上所述,现有技术中存在当存储系统中的任一存储节点发生故障时迁移数据量较大且恢复时间较长的问题。
发明内容
本发明的目的是提供一种故障恢复方法及系统,以解决现有技术中存在的当存储系统中的任一存储节点发生故障时迁移数据量较大且恢复时间较长的问题。
为了实现上述目的,本发明提供如下技术方案:
一种故障恢复方法,应用于预先建立的存储系统,该存储系统包括至少一个存储节点组,每个所述存储节点组均包括M个执行存储工作的第一存储节点及N个未执行存储工作的第二存储节点,M和N均为正整数;该方法包括:
当任一第一存储节点发生故障时,确定发生故障的第一存储节点为故障存储节点,所述故障存储节点对应的存储节点组为故障存储节点组;
按照预设原则选取所述故障存储节点组中的一个第二存储节点为替补存储节点;
利用所述替补存储节点取代所述故障存储节点,并完成所述故障存储节点需执行的存储工作。
优选的,所述存储系统的预先建立过程包括:
按照预设的拓扑结构模型确定每个所述存储节点组的拓扑结构位置,以形成所述存储系统。
优选的,所述存储系统的预先建立过程包括:
按照递增顺序依次为所述存储节点组中的全部第一存储节点进行编号,每两个相邻的所述第一存储节点各自对应的编号的差为预设数值,所述预设数值为大于或者等于2的整数。
优选的,所述按照预设原则选取所述故障存储节点组中的一个第二存储节点为替补存储节点之后,还包括:
判断所述故障存储节点所处的位置处是否放置过其他存储节点,如果否,则确定所述故障存储节点的编号加上1所得的编号为所述替补存储节点的编号;
如果是,则判断所述故障存储节点所处的位置处放置过的其他存储节点的个数是否为奇数,如果是,则确定所述故障存储节点的编号减去1所得的编号为所述替补存储节点的编号,如果否,则确定所述故障存储节点的编号加上1所得的编号为所述替补存储节点的编号。
优选的,按照预设原则选取所述故障存储节点组中的一个第二存储节点为替补存储节点之后,还包括:
将所述故障存储节点取下,并将所述替补存储节点由原位置移动至所述故障存储节点的位置上;
将一个新的存储节点作为第二存储节点放置于所述替补存储节点的原位置上。
优选的,所述存储系统的预先建立过程包括:
建立至少一个所述存储节点组,每个所述存储节点组均包括N个未执行存储工作的第二存储节点,N的取值与所述存储节点组中的存储节点的性质相对应。
优选的,所述第一存储节点和第二存储节点均为硬盘,所述存储节点组为主机,所述N的取值为1。
一种故障恢复装置,应用于预先建立的存储系统,该存储系统包括至少一个存储节点组,每个所述存储节点组均包括M个执行存储工作的第一存储节点及N个未执行存储工作的第二存储节点,M和N均为正整数;该装置包括:
确定模块,用于当任一第一存储节点发生故障时,确定发生故障的第一存储节点为故障存储节点,所述故障存储节点对应的存储节点组为故障存储节点组;
选取模块,用于按照预设原则选取所述故障存储节点组中的一个第二存储节点为替补存储节点;
取代模块,用于利用所述替补存储节点取代所述故障存储节点,并完成所述故障存储节点需执行的存储工作。
本发明提供的一种故障恢复方法及系统,应用于预先建立的存储系统,该存储系统包括至少一个存储节点组,每个所述存储节点组均包括M个执行存储工作的第一存储节点及N个未执行存储工作的第二存储节点,M和N均为正整数;该方法包括:当任一第一存储节点发生故障时,确定发生故障的第一存储节点为故障存储节点,所述故障存储节点对应的存储节点组为故障存储节点组;按照预设原则选取所述故障存储节点组中的一个第二存储节点为替补存储节点;利用所述替补存储节点取代所述故障存储节点,并完成所述故障存储节点需执行的存储工作。与现有技术相比,本申请公开的故障恢复方法应用的存储系统中,每个存储节点组均具有执行存储工作的第一存储节点及未执行存储工作的第二存储节点,因此,通过上述故障恢复方法,当任一第一存储节点发生故障时,可用与发生故障的第一存储节点同一个存储节点组的第二存储节点去完成发生故障的第一存储节点的存储工作,即,将发生故障的第一存储节点的存储任务分配到该第一存储节点同一个存储节点组的一个第二存储节点,通常是将故障存储节点的数据的备份转移至替补存储节点中,在无需进行背景技术中所描述的缩容和扩容的前提下,实现了系统的自我恢复,从而减少了运维的工作量,减少了系统故障的恢复时间和迁移的数据量,降低了系统恢复带来的风险。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种故障恢复方法的流程图;
图2为本发明实施例提供的一种故障恢复装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的一种故障恢复方法的流程图,该方法应用于预先建立的存储系统,该存储系统包括至少一个存储节点组,每个存储节点组均包括M个执行存储工作的第一存储节点及N个未执行存储工作的第二存储节点,M和N均为正整数;其中,M和N的具体取值可以根据实际需要进行确定,而未执行存储工作的第二存储节点,表示第二存储节点是空白的。
上述一种故障恢复方法,可以包括:
S11:当任一第一存储节点发生故障时,确定发生故障的第一存储节点为故障存储节点,故障存储节点对应的存储节点组为故障存储节点组。
其中,存储节点发生故障即其无法正常完成存储数据,并供其他设备进行读写其存储的数据的工作。发生故障的原因可以是多种多样的,如病毒入侵等,在此不再详细介绍。
S12:按照预设原则选取故障存储节点组中的一个第二存储节点为替补存储节点。
其中,预设原则可由工作人员根据实际需要进行确定,可以是随机原则,也可以是将故障存储节点组内的全部第二存储节点进行一个排序,并按照排序递增的顺序依次为其编号,优先选取编号较小的第二存储节点。当然也可以根据实际需要确定其他选取第二存储节点的方式作为预设原则,并不仅限于上述两种方式。
S13:利用替补存储节点取代故障存储节点,并完成故障存储节点需执行的存储工作。
其中,替补存储节点取代故障存储节点,并完成故障存储节点需执行的存储工作时,需要首先将故障存储节点中存储的数据的备份迁移至替补存储节点中,然后由替补存储节点完成后续的存储工作。
本申请公开的故障恢复方法应用的存储系统中,每个存储节点组均具有执行存储工作的第一存储节点及未执行存储工作的第二存储节点,因此,通过上述故障恢复方法,当任一第一存储节点发生故障时,可用与发生故障的第一存储节点同一个存储节点组的第二存储节点去完成发生故障的第一存储节点的存储工作,即,将发生故障的第一存储节点的存储任务分配到该第一存储节点同一个存储节点组的一个第二存储节点,通常是将故障存储节点的数据的备份转移至替补存储节点中,在无需进行背景技术中所描述的缩容和扩容的前提下,实现了系统的自我恢复,从而减少了运维的工作量,减少了系统故障的恢复时间和迁移的数据量,降低了系统恢复带来的风险。
需要说明的是,本申请公开的上述故障恢复方法主要针对的是当任一存储节点发生故障时对于发生故障的存储节点的存储任务的分配,其中,应用的存储系统可以是集群系统或者分布式存储系统,每个存储节点组具有多个存储节点(即进程),这是一种多副本的冗余方式。而对于数据的存储位置,即将数据存储至哪个或哪些正常工作的存储节点,可以采用一致性哈希算法得到。
另外,如果任一第一存储节点发生故障,而故障存储节点组内的全部第二存储节点已经被使用(通常为已经在该组内的其他节点发生故障时被使用),则启动缩容,即减少存储节点并根据一致性哈希算法进行数据迁移。具体为对于已经发生故障的第一存储节点不再使用,而是将其需要执行的存储工作按照一致性哈希算法分配至其他能够正常使用的第一存储节点内。
本发明实施例提供的一种故障恢复方法中,存储系统的预先建立过程可以包括:
按照预设的拓扑结构模型确定每个存储节点组的拓扑结构位置,以形成存储系统。
预设的拓扑结构模型可以是工作人员根据实际需要进行确定,而按照预设的拓扑结构模型确定每个存储节点组的拓扑结构位置,可以使得一个存储节点组对应一个拓扑结构位置。因此,当任一第一存储节点发生故障时,由故障发生至恢复,存储系统的整体拓扑结构不会发生变化,进一步缩短了系统恢复时间。
上述实施例提供的一种故障恢复方法,存储系统的预先建立过程可以包括:
按照递增顺序依次为存储节点组中的全部第一存储节点进行编号,每两个相邻的第一存储节点各自对应的编号的差为预设数值,预设数值为大于或者等于2的整数。
其中,预设数值可根据实际需要进行设定,优选为2。按照递增顺序依次为存储节点组中的全部第一存储节点进行编号,可以是先将存储节点组进行排序,然后按照存储节点组的排序递增的顺序为每个存储节点组内的第一存储节点进行编号。如存储节点组有3个,每个存储节点组内有2个第一存储节点,当预设数值取值为2时,则先将存储节点组进行排序,分为:存储节点组1、存储节点组2及存储节点3,进而为每个存储节点组内的第一存储节点进行编号,可以为:存储节点组1内的2个第一存储节点的编号分别为2和4;存储节点组2内的2个第一存储节点的编号分别为6和8;存储节点组3内的2个第一存储节点的编号分别为10和12。由此,建立存储系统时,全部存储节点均为奇数或者均为偶数,具体选取哪类数可由工作人员根据实际情况进行确定。
现有技术中对存储节点编号通常采用编号递增的方式,而这种方式必须等待一个存储节点部署完毕之后才能部署下一个存储节点,从而无法同时实现大量存储节点的部署;而本申请按照上述方式为第一存储节点进行编号,由于对于第一存储节点的编号具有规律性,所以只需要按照预先为第一存储节点分配的编号进行部署,实现了存储系统创建时的部署程序的并发执行,即能够同时实现大量存储节点的部署,减少了存储系统的建立时间,提高了建立效率。
上述实施例提供的一种故障恢复方法中,按照预设原则选取故障存储节点组中的一个第二存储节点为替补存储节点之后,还可以包括:
判断故障存储节点所处的位置处是否放置过其他存储节点,如果否,则确定故障存储节点的编号加上1所得的编号为替补存储节点的编号;
如果是,则判断故障存储节点所处的位置处放置过的其他存储节点的个数是否为奇数,如果是,则确定故障存储节点的编号减去1所得的编号为替补存储节点的编号,如果否,则确定故障存储节点的编号加上1所得的编号为替补存储节点的编号。
其中,故障存储节点的位置上没有放置过其他存储节点,说明处于该位置上的存储节点未发生过故障。相反,存储节点的位置上放置过其他存储节点,说明处于该位置上的存储节点发生过故障,且每次发生故障都需要更换一个存储节点,因此,在故障存储节点的位置上放置过的其他存储节点的个数即为该位置上的存储节点发生过的故障次数。
举例说明上述步骤:存储节点组有3个,每个存储节点组内有2个第一存储节点,当预设数值取值为2时,则先将存储节点组进行排序,分为:存储节点组1、存储节点组2及存储节点3,进而为每个存储节点组内的第一存储节点进行编号,可以为:存储节点组1内的2个第一存储节点的编号分别为2和4;存储节点组2内的2个第一存储节点的编号分别为6和8;存储节点组3内的2个第一存储节点的编号分别为10和12。当编号为2的第一存储节点发生故障成为故障存储节点时,则选取存储节点组1内的一个第二存储节点作为替补存储节点取代编号为2的故障存储节点,而如果该故障存储节点是第一个被放置于其对应位置上的存储节点,则将替补存储节点的编号设置为2加上1即3。如果运行一段时间之后,编号为3的存储节点发生故障成为故障存储节点时,该位置上已经有1个,即奇数个其他存储节点被放置过,则将替补存储节点的编号设置为3减去1,即2。
由此,能够保证存储节点组内的存储节点的编号在故障发生至系统恢复的过程中均保持一定的规律性,正是由于这种规律性,当发生故障后,工作人员可通过与存储节点对应的工作日志快速定位到发生故障的存储节点组及故障存储节点,有利于系统的快速恢复。
上述实施例提供的一种故障恢复方法中,按照预设原则选取故障存储节点组中的一个第二存储节点为替补存储节点之后,还可以包括:
将故障存储节点取下,并将替补存储节点由原位置移动至故障存储节点的位置上;
将一个新的存储节点作为第二存储节点放置于替补存储节点的原位置上。
由此,能够保证当任一第一存储节点发生故障时,都能够在该故障存储节点组内确定出空白的第二存储节点,以保证系统的快速恢复。
上述实施例提供的一种故障恢复方法,存储系统的预先建立过程可以包括:
建立至少一个存储节点组,每个存储节点组均包括N个未执行存储工作的第二存储节点,N的取值与存储节点组中的存储节点的性质相对应。
存储节点可以根据实际需要进行确定,可以是硬盘或者存储机柜等,对应不同的存储节点,其存储节点组也是不同的,如硬盘对应的存储节点组为主机。但是对于不同的存储节点,其性质不同,因此一个存储节点组中所需要的空白的存储节点的数量也不相同。如第一存储节点和第二存储节点均为硬盘,则存储节点组为主机,由于一个主机中同时有两个硬盘发生故障时会导致系统崩溃,因此通常情况下在一个时刻最多会有一个硬盘发生故障,因此,N的取值为1,即空白的硬盘的数量为1。这样不仅能够保证系统的快速恢复,还能避免对于存储节点资源的浪费。
与上述方法实施例相对应,本发明实施例还提供了一种故障恢复装置,应用于预先建立的存储系统,该存储系统包括至少一个存储节点组,每个存储节点组均包括M个执行存储工作的第一存储节点及N个未执行存储工作的第二存储节点,M和N均为正整数;如图2所示,该装置可以包括:
确定模块21,用于当任一第一存储节点发生故障时,确定发生故障的第一存储节点为故障存储节点,故障存储节点对应的存储节点组为故障存储节点组;
选取模块22,用于按照预设原则选取故障存储节点组中的一个第二存储节点为替补存储节点;
取代模块23,用于利用替补存储节点取代故障存储节点,并完成故障存储节点需执行的存储工作。
本申请公开的故障恢复装置应用的存储系统中,每个存储节点组均具有执行存储工作的第一存储节点及未执行存储工作的第二存储节点,因此,通过上述故障恢复装置,当任一第一存储节点发生故障时,可用与发生故障的第一存储节点同一个存储节点组的第二存储节点去完成发生故障的第一存储节点的存储工作,即,将发生故障的第一存储节点的存储任务分配到该第一存储节点同一个存储节点组的一个第二存储节点,通常是将故障存储节点的数据的备份转移至替补存储节点中,在无需进行背景技术中所描述的缩容和扩容的前提下,实现了系统的自我恢复,从而减少了运维的工作量,减少了系统故障的恢复时间和迁移的数据量,降低了系统恢复带来的风险。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种故障恢复方法,其特征在于,应用于预先建立的存储系统,该存储系统包括至少一个存储节点组,每个所述存储节点组均包括M个执行存储工作的第一存储节点及N个未执行存储工作的第二存储节点,M和N均为正整数;该方法包括:
当任一第一存储节点发生故障时,确定发生故障的第一存储节点为故障存储节点,所述故障存储节点对应的存储节点组为故障存储节点组;
按照预设原则选取所述故障存储节点组中的一个第二存储节点为替补存储节点;
利用所述替补存储节点取代所述故障存储节点,并完成所述故障存储节点需执行的存储工作。
2.根据权利要求1所述的方法,其特征在于,所述存储系统的预先建立过程包括:
按照预设的拓扑结构模型确定每个所述存储节点组的拓扑结构位置,以形成所述存储系统。
3.根据权利要求1所述的方法,其特征在于,所述存储系统的预先建立过程包括:
按照递增顺序依次为所述存储节点组中的全部第一存储节点进行编号,每两个相邻的所述第一存储节点各自对应的编号的差为预设数值,所述预设数值为大于或者等于2的整数。
4.根据权利要求3所述的方法,其特征在于,所述按照预设原则选取所述故障存储节点组中的一个第二存储节点为替补存储节点之后,还包括:
判断所述故障存储节点所处的位置处是否放置过其他存储节点,如果否,则确定所述故障存储节点的编号加上1所得的编号为所述替补存储节点的编号;
如果是,则判断所述故障存储节点所处的位置处放置过的其他存储节点的个数是否为奇数,如果是,则确定所述故障存储节点的编号减去1所得的编号为所述替补存储节点的编号,如果否,则确定所述故障存储节点的编号加上1所得的编号为所述替补存储节点的编号。
5.根据权利要求4所述的方法,其特征在于,按照预设原则选取所述故障存储节点组中的一个第二存储节点为替补存储节点之后,还包括:
将所述故障存储节点取下,并将所述替补存储节点由原位置移动至所述故障存储节点的位置上;
将一个新的存储节点作为第二存储节点放置于所述替补存储节点的原位置上。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述存储系统的预先建立过程包括:
建立至少一个所述存储节点组,每个所述存储节点组均包括N个未执行存储工作的第二存储节点,N的取值与所述存储节点组中的存储节点的性质相对应。
7.根据权利要求6所述的方法,其特征在于,所述第一存储节点和第二存储节点均为硬盘,所述存储节点组为主机,所述N的取值为1。
8.一种故障恢复装置,其特征在于,应用于预先建立的存储系统,该存储系统包括至少一个存储节点组,每个所述存储节点组均包括M个执行存储工作的第一存储节点及N个未执行存储工作的第二存储节点,M和N均为正整数;该装置包括:
确定模块,用于当任一第一存储节点发生故障时,确定发生故障的第一存储节点为故障存储节点,所述故障存储节点对应的存储节点组为故障存储节点组;
选取模块,用于按照预设原则选取所述故障存储节点组中的一个第二存储节点为替补存储节点;
取代模块,用于利用所述替补存储节点取代所述故障存储节点,并完成所述故障存储节点需执行的存储工作。
CN201510612302.9A 2015-09-23 2015-09-23 一种故障恢复方法及系统 Active CN105335251B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510612302.9A CN105335251B (zh) 2015-09-23 2015-09-23 一种故障恢复方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510612302.9A CN105335251B (zh) 2015-09-23 2015-09-23 一种故障恢复方法及系统

Publications (2)

Publication Number Publication Date
CN105335251A true CN105335251A (zh) 2016-02-17
CN105335251B CN105335251B (zh) 2018-11-02

Family

ID=55285806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510612302.9A Active CN105335251B (zh) 2015-09-23 2015-09-23 一种故障恢复方法及系统

Country Status (1)

Country Link
CN (1) CN105335251B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107294790A (zh) * 2017-07-21 2017-10-24 郑州云海信息技术有限公司 一种集群系统中控制器节点故障恢复方法
CN107342905A (zh) * 2017-08-28 2017-11-10 郑州云海信息技术有限公司 一种集群存储系统故障转移的节点调度方法及系统
CN108021490A (zh) * 2017-12-06 2018-05-11 郑州云海信息技术有限公司 一种硬盘故障域检测方法、装置和计算机可读存储介质
CN108021486A (zh) * 2017-11-21 2018-05-11 平安科技(深圳)有限公司 电子装置、征信数据处理的方法及存储介质
CN108156040A (zh) * 2018-01-30 2018-06-12 北京交通大学 一种分布式云存储系统中的中央控制节点
CN108170375A (zh) * 2017-12-21 2018-06-15 创新科存储技术有限公司 一种分布式存储系统中的超限保护方法和装置
CN108958945A (zh) * 2018-07-27 2018-12-07 三盟科技股份有限公司 一种基于云计算环境下的ar教学资源处理方法及系统
CN109145056A (zh) * 2018-09-07 2019-01-04 郑州云海信息技术有限公司 一种数据缩容的方法、装置和计算机可读存储介质
CN109981777A (zh) * 2019-03-27 2019-07-05 深圳市网心科技有限公司 基于cdn的副本维护方法、服务器、副本存储节点以及系统
CN110442420A (zh) * 2019-06-28 2019-11-12 苏州浪潮智能科技有限公司 一种存储节点的工作迁移方法与装置
CN110445822A (zh) * 2018-05-03 2019-11-12 中移(苏州)软件技术有限公司 一种对象存储方法及装置
CN110868564A (zh) * 2018-08-28 2020-03-06 杭州海康威视系统技术有限公司 一种存储任务分配方法、云存储系统及电子设备
CN110990195A (zh) * 2019-11-24 2020-04-10 浪潮电子信息产业股份有限公司 一种数据恢复方法、设备及存储介质
CN111045845A (zh) * 2019-11-29 2020-04-21 苏州浪潮智能科技有限公司 一种数据回传方法、装置、设备及计算机可读存储介质
CN111488245A (zh) * 2020-04-14 2020-08-04 深圳市小微学苑科技有限公司 分布式存储的高级管理方法及系统
CN111818159A (zh) * 2020-07-08 2020-10-23 腾讯科技(深圳)有限公司 数据处理节点的管理方法、装置、设备及存储介质
CN111813348A (zh) * 2020-09-08 2020-10-23 苏州浪潮智能科技有限公司 统一存储设备中的节点事件处理装置、方法、设备及介质
CN113821176A (zh) * 2021-09-29 2021-12-21 重庆紫光华山智安科技有限公司 一种数据迁移的处理方法、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050108484A1 (en) * 2002-01-04 2005-05-19 Park Sung W. System and method for highspeed and bulk backup
CN104866430A (zh) * 2015-04-30 2015-08-26 上海交通大学 结合主从备份和纠删码的内存计算系统高可用优化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050108484A1 (en) * 2002-01-04 2005-05-19 Park Sung W. System and method for highspeed and bulk backup
CN104866430A (zh) * 2015-04-30 2015-08-26 上海交通大学 结合主从备份和纠删码的内存计算系统高可用优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
佚名: "双机热备、双机互备和双机双工,这三者之间的区别", 《HTTP://BLOG.CSDN.NET/HERRY2008/ARTICLE/DETAILS/1916258》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107294790A (zh) * 2017-07-21 2017-10-24 郑州云海信息技术有限公司 一种集群系统中控制器节点故障恢复方法
CN107342905A (zh) * 2017-08-28 2017-11-10 郑州云海信息技术有限公司 一种集群存储系统故障转移的节点调度方法及系统
CN108021486A (zh) * 2017-11-21 2018-05-11 平安科技(深圳)有限公司 电子装置、征信数据处理的方法及存储介质
CN108021490A (zh) * 2017-12-06 2018-05-11 郑州云海信息技术有限公司 一种硬盘故障域检测方法、装置和计算机可读存储介质
CN108170375A (zh) * 2017-12-21 2018-06-15 创新科存储技术有限公司 一种分布式存储系统中的超限保护方法和装置
CN108170375B (zh) * 2017-12-21 2020-12-18 创新科技术有限公司 一种分布式存储系统中的超限保护方法和装置
CN108156040A (zh) * 2018-01-30 2018-06-12 北京交通大学 一种分布式云存储系统中的中央控制节点
CN110445822A (zh) * 2018-05-03 2019-11-12 中移(苏州)软件技术有限公司 一种对象存储方法及装置
CN110445822B (zh) * 2018-05-03 2021-11-30 中移(苏州)软件技术有限公司 一种对象存储方法及装置
CN108958945A (zh) * 2018-07-27 2018-12-07 三盟科技股份有限公司 一种基于云计算环境下的ar教学资源处理方法及系统
CN110868564A (zh) * 2018-08-28 2020-03-06 杭州海康威视系统技术有限公司 一种存储任务分配方法、云存储系统及电子设备
CN110868564B (zh) * 2018-08-28 2021-06-04 杭州海康威视系统技术有限公司 一种存储任务分配方法、云存储系统及电子设备
CN109145056A (zh) * 2018-09-07 2019-01-04 郑州云海信息技术有限公司 一种数据缩容的方法、装置和计算机可读存储介质
CN109981777A (zh) * 2019-03-27 2019-07-05 深圳市网心科技有限公司 基于cdn的副本维护方法、服务器、副本存储节点以及系统
CN110442420A (zh) * 2019-06-28 2019-11-12 苏州浪潮智能科技有限公司 一种存储节点的工作迁移方法与装置
CN110990195A (zh) * 2019-11-24 2020-04-10 浪潮电子信息产业股份有限公司 一种数据恢复方法、设备及存储介质
CN111045845A (zh) * 2019-11-29 2020-04-21 苏州浪潮智能科技有限公司 一种数据回传方法、装置、设备及计算机可读存储介质
CN111488245A (zh) * 2020-04-14 2020-08-04 深圳市小微学苑科技有限公司 分布式存储的高级管理方法及系统
CN111818159A (zh) * 2020-07-08 2020-10-23 腾讯科技(深圳)有限公司 数据处理节点的管理方法、装置、设备及存储介质
CN111818159B (zh) * 2020-07-08 2024-04-05 腾讯科技(深圳)有限公司 数据处理节点的管理方法、装置、设备及存储介质
CN111813348A (zh) * 2020-09-08 2020-10-23 苏州浪潮智能科技有限公司 统一存储设备中的节点事件处理装置、方法、设备及介质
CN113821176A (zh) * 2021-09-29 2021-12-21 重庆紫光华山智安科技有限公司 一种数据迁移的处理方法、装置及存储介质

Also Published As

Publication number Publication date
CN105335251B (zh) 2018-11-02

Similar Documents

Publication Publication Date Title
CN105335251A (zh) 一种故障恢复方法及系统
CN102629224B (zh) 一种基于云平台的一体化数据容灾方法及其装置
CN103942112A (zh) 磁盘容错方法、装置及系统
CN104965850A (zh) 一种基于开源技术的数据库高可用实现方法
CN103729280A (zh) 一种虚拟机高可用机制
CN102308273A (zh) 存储系统
CN102402395A (zh) 基于仲裁磁盘的高可用系统不间断运行方法
CN103516736A (zh) 分布式缓存系统的数据恢复方法及装置
CN110190991B (zh) 一种多应用场景下的分布式流处理系统的容错方法
CN105242990A (zh) 基于云平台的数据备份方法和装置
US9164849B2 (en) Backup jobs scheduling optimization
CN111771193A (zh) 用于在生产集群中备份最终一致的数据库的系统和方法
CN113051104B (zh) 基于纠删码的磁盘间数据恢复方法及相关装置
US20050283636A1 (en) System and method for failure recovery in a cluster network
CN106569751A (zh) 一种多控制器缓存镜像方法及系统
CN103051691A (zh) 分区分配方法、装置以及分布式存储系统
CN103560907A (zh) 双机负载均衡设备的管理方法和装置
CN104424052A (zh) 一种自动冗余的分布式存储系统及方法
CN110727508A (zh) 一种任务调度系统和调度方法
CN108469996A (zh) 一种基于自动快照的系统高可用方法
US9195528B1 (en) Systems and methods for managing failover clusters
CN101206596A (zh) 复原系统操作的方法
CN106201354A (zh) 数据存储方法及系统
CN103902401A (zh) 基于监控的虚拟机容错方法及装置
CN113946471A (zh) 基于对象存储的分布式文件级备份方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant