CN104679611A - 数据资源复制方法以及装置 - Google Patents

数据资源复制方法以及装置 Download PDF

Info

Publication number
CN104679611A
CN104679611A CN201510098052.1A CN201510098052A CN104679611A CN 104679611 A CN104679611 A CN 104679611A CN 201510098052 A CN201510098052 A CN 201510098052A CN 104679611 A CN104679611 A CN 104679611A
Authority
CN
China
Prior art keywords
node
message
data resource
shutdown
memory node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510098052.1A
Other languages
English (en)
Other versions
CN104679611B (zh
Inventor
张敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Uniview Technologies Co Ltd
Original Assignee
Zhejiang Uniview Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Uniview Technologies Co Ltd filed Critical Zhejiang Uniview Technologies Co Ltd
Priority to CN201510098052.1A priority Critical patent/CN104679611B/zh
Publication of CN104679611A publication Critical patent/CN104679611A/zh
Application granted granted Critical
Publication of CN104679611B publication Critical patent/CN104679611B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种数据资源复制方法以及装置,其中该方法包括:在分别向多个存储节点发送具有数据资源的写入请求后,若判断多个存储节点中的任意存储节点进行数据资源写入失败,将数据资源写入失败的存储节点作为故障节点;向管理节点发送查询消息;在接收到管理节点回复的应答消息后,根据管理节点回复的应答消息确定所述故障节点的关机状态为正常关机状态时,则不向备份节点发送所述写入请求,当确定所述关机状态为非正常关机状态时,将所述具有数据资源的写入请求发送至备份节点。避免了因关机的存储节点开机时,将写入备份节点的数据资源大量转移到开机的存储节点的情况,进而提高swift云存储集群的可靠性以及可用性。

Description

数据资源复制方法以及装置
技术领域
本发明涉及通信技术领域,尤其涉及数据资源复制方法以及装置。
背景技术
由于Openstack Object Storage(Swift)具有强大的扩展性、冗余性和持久性,目前多基于Swift来完成使用普通硬件构建冗余的、可扩展的分布式云存储集群架构。
如图1所示,基于swift的云存储集群架构中包括管理节点(Manager)、接入节点(Proxy)以及存储节点(Storage)。由于Swift是采用多份(>=3)复制机制来提高数据资源的可靠性的技术,因此在访问swift云存储时,客户端将具有数据资源的写入请求发送到管理节点后,由管理节点将该写入请求分发到接入节点上,接入节点将该数据资源按照指定的副本数量写入多个存储节点上,来完成数据资源的存储。
现有技术中,在数据资源写入存储节点的过程中,如果对应的存储节点关机,接入节点会自动寻找handoff(后备)资源,即备份节点,来保证写入的数据资源按指定的副本数量写入,并向客户端返回写入成功。
但是,在云存储集群系统的维护操作中通常需要重启或关机存储节点,例如升级存储节点软件或更换存储节点硬件时。这种情况的存储节点可以很快正常开机。因此,在数据资源写入存储节点时若检测到存储节点关机,且关机的存储节点正是因为上述原因造成的正常关机,那么该关机的存储节点将很快恢复正常。此时,若将数据资源写入备份节点后,根据swift机制的标准还要将写入备份节点上的数据资源转移到恢复正常的存储节点,这样一来,在具有大规模的存储节点组建的swift云存储集群架构中,若大量的进行数据资源复制、转移,则会大幅降低swift云存储集群架构的可用性以及可靠性。
发明内容
针对现有技术的缺陷,本发明提供了数据资源复制方法以及装置。
本发明提供一种数据资源复制方法,应用于基于Openstack ObjectStorage(swift)的云存储集群的Proxy接入节点,所述存储集群还包括Manager管理节点、Storage存储节点,其中,该方法包括:
在分别向多个存储节点发送具有数据资源的写入请求后,若判断多个存储节点中的任意存储节点进行数据资源写入失败,将数据资源写入失败的存储节点作为故障节点;
向管理节点发送查询消息,以查询所述故障节点的关机状态;
在接收到管理节点回复的应答消息后,根据管理节点回复的应答消息确定所述故障节点的关机状态为正常关机状态还是非正常关机状态,当确定所述关机状态为正常关机状态时,则不向备份节点发送所述写入请求,当确定所述关机状态为非正常关机状态时,将所述具有数据资源的写入请求发送至备份节点。
本发明还提供一种数据资源复制方法,应用于基于Openstack ObjectStorage(swift)的云存储集群的Manager管理节点,所述存储集群还包括Proxy接入节点、Storage存储节点,所述方法包括:
接收存储节点发送的关机消息,将所述存储节点的关机消息保存至全局关机信息中;
在接收到查询存储节点关机状态的查询消息后,获取所述查询消息中携带的存储节点的节点标识;
检查所述全局关机信息中是否有与所述存储节点的节点标识对应的存储节点的关机消息,并得到查询结果;
根据所述查询结果回复应答消息,以使发送所述查询消息的节点根据所述查询结果判断所述存储节点的关机状态。
本发明还提供一种数据资源复制方法,应用于基于Openstack ObjectStorage(swift)的云存储集群的Storage存储节点,所述存储集群还包括Proxy接入节点、Manager管理节点,所述方法包括:
定期向存储有自身保存的数据资源的副本的其他存储节点发送审核消息,以检查本地存储的数据资源与保存至其他存储节点的副本内容是否一致;
若在预设超时时间未接收到所述其他存储节点中任意存储节点回复的回应消息,将未回复回应消息的存储节点作为故障节点,并向管理节点发送查询消息,以查询所述故障节点的关机状态;
接收管理节点回复的应答消息,若根据所述应答消息确定所述故障节点为非正常关机状态,将所述本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点,若根据所述应答消息确定所述故障节点为正常关机状态,则不会将所述本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点。
本发明还提供一种数据资源复制装置,应用于基于Openstack ObjectStorage(swift)的云存储集群的Proxy接入节点,所述存储集群还包括Manager管理节点、Storage存储节点,所述装置包括:
判断单元,用于在分别向多个存储节点发送具有数据资源的写入请求后,若判断多个存储节点中的任意存储节点进行数据资源写入失败,将数据资源写入失败的存储节点作为故障节点;
发送单元,用于向管理节点发送查询消息,以查询所述故障节点的关机状态;
确定单元,用于在接收到管理节点回复的应答消息后,根据管理节点回复的应答消息确定所述故障节点的关机状态为正常关机状态还是非正常关机状态,当确定所述关机状态为正常关机状态时,则不向备份节点发送所述写入请求,当确定所述关机状态为非正常关机状态时,将所述具有数据资源的写入请求发送至备份节点。
本发明还提供一种数据资源复制装置,应用于基于Openstack ObjectStorage(swift)的云存储集群的Manager管理节点,所述存储集群还包括Proxy接入节点、Storage存储节点,所述装置包括:
保存单元,用于接收存储节点发送的关机消息,将所述存储节点的关机消息保存至全局关机信息中;
获取单元,用于在接收到查询存储节点关机状态的查询消息后,获取所述查询消息中携带的存储节点的节点标识;
检查单元,用于检查预存的全局关机信息中是否有与所述存储节点的节点标识对应的存储节点的关机消息,并得到查询结果;
发送单元,用于根据所述查询结果回复携带有节点状态标记的应答消息,以使发送所述查询消息的节点根据所述节点状态标记判断所述存储节点的关机状态。
本发明还提供一种数据资源复制装置,应用于基于Openstack ObjectStorage(swift)的云存储集群的Storage存储节点,所述存储集群还包括Proxy接入节点、Manager管理节点,所述装置包括:
审核单元,用于定期向存储有自身保存的数据资源的副本的其他存储节点发送审核消息,以检查本地存储的数据资源与保存至其他存储节点的副本内容是否一致;
发送单元,用于在预设超时时间未接收到所述其他存储节点中任意存储节点回复的回应消息,将未回复回应消息的存储节点作为故障节点,并向管理节点发送具有所述故障节点的查询消息,以查询所述故障节点的关机状态;
接收单元,用于接收管理节点回复的具有节点状态标记的应答消息,若根据所述节点状态标记确定所述故障节点为非正常关机状态,将本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点,若根据所述应答消息确定所述故障节点为正常关机状态,则不会将所述本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点。
本发明提供的数据资源复制方法以及装置,在分别向多个存储节点发送写入请求后,若存在数据资源写入失败的故障节点,查询该故障节点的关机状态,并在确定该故障节点的关机状态为正常关机状态时,向管理节点发送与故障节点对应的数据更新标记,以使所述故障节点在开机后获取所述数据资源,并使用所述数据资源同步更新其保存的数据资源。避免了因关机的存储节点开机时,将写入备份节点的数据资源大量转移到开机的存储节点的情况,进而提高swift云存储集群的可靠性以及可用性。
附图说明
图1是本发明实施例中的基于swift的云存储集群组网环境示意图;
图2是本发明实施例中一种数据资源复制方法流程示意图;
图3是本发明实施例中另一种数据资源复制方法流程示意图;
图4是本发明实施例中另一种数据资源复制方法流程示意图;
图5是本发明实施例中一种数据资源复制装置的逻辑结构示意图;
图6是本发明实施例中另一种数据资源复制装置的逻辑结构示意图;
图7是本发明实施例中另一种数据资源复制装置的逻辑结构示意图;
图8是本发明实施例中数据资源复制装置所在管理节点、接入节点或存储节点的硬件架构示意图。
具体实施方式
为使本申请的目的,技术方案及优点更加清楚明白,以下参照附图对本申请方案做进一步的详细说明。
为了解决现有技术中存在的问题,本发明提供了数据资源复制方法以及装置。
请参考图2,为本发明提供的数据资源复制方法的处理流程示意图,该数据资源复制方法可应用于基于Openstack Object Storage(swift)的云存储集群的Manager管理节点,所述存储集群还包括Proxy接入节点、Storage存储节点,该数据资源复制方法包括以下步骤:
步骤201,接收存储节点发送的关机消息,将所述存储节点的关机消息保存至全局关机信息中;
实际应用中,当客户端需将数据资源写入swift云存储集群时,swift云存储集群中的管理节点可以接收到客户端发送的携带有待写入数据资源的写入请求,并由管理节点将该写入请求分配给接入节点,以使接入节点将该写入请求发送至对应的多个存储节点进行数据资源的写入。
本发明实施例中的管理节点还用于管理各存储节点的开、关机消息,在有存储节点主动关机或主动重启时,管理节点可以接收到该存储节点的关机消息,并将该关机消息记录在本地的全局关机信息中。
其中,该关机消息中具有发送该关机消息的存储节点的节点标识,例如该存储节点的IP地址。该全局关机信息也可以存储于管理节点后台服务的全局数据结构中。
本发明实施例中还可以预先为管理节点设置一定时器,并事先为该定时器设置一定时时长,即预设容忍时间。
管理节点在将接收的关机消息存储至全局关机信息时,开启该定时器,以记录接收到该关机消息的时间。若在接收关机消息后的时间到达预设容忍时间之前,管理节点接收到关机的存储节点的开机消息,可以确定该存储节点已开机,那么将该存储节点从所述全局关机信息中删除。
若接收关机消息后的时间到达预设容忍时间时,仍未接收到该关机的存储节点的开机消息,可以确定该存储节点为非正常关机状态,即该存储节点故障,那么将该存储节点从全局关机信息中删除。同时,还可以向swift云存储集群管理员发送告警通知,提醒swift云存储集群管理员,该存储节点故障。
步骤202,在接收到查询存储节点关机状态的查询消息后,获取所述查询消息中携带的存储节点的节点标识;
本发明实施例中的管理节点还可以为其他节点提供查询服务。例如,接入节点或者存储节点可以向管理节点发送具有待查询的存储节点的节点标识的查询消息,以根据查询结果判断该待查询的存储节点是正常关机状态还是非正常关机状态。例如,该节点标识可以是存储节点的IP地址。
步骤203,检查预存的全局关机信息中是否有与所述存储节点的节点标识对应的存储节点的关机消息,并得到查询结果;
在管理节点接收到接入节点或者存储节点发送的具有待查询的存储节点IP地址的查询消息时,可以查找本地的全局关机信息中是否存在与该存储节点IP地址对应的关机消息,并得到查询结果。
其中,该查询结果为与查询消息中携带的待查询的存储节点IP地址对应的节点状态标记,该节点状态标记用于表征管理节点的全局关机信息中是否具有该待查询的存储节点的关机消息。若管理节点的全局关机信息中具有该待查询的存储节点的关机消息,那么该节点状态标记可以是关机标记(例如,节点状态标记为1);否则该节点状态标记可以为空(例如,该节点状态标记为null),或者是其他用于表征非正常关机的标记(例如,该节点状态标记为0)。
步骤204,根据所述查询结果回复携带有节点状态标记的应答消息,以使发送所述查询消息的节点根据所述节点状态标记判断所述存储节点的关机状态。
之后,向发送查询消息的节点发送具有查询结果的应答消息,以使发送查询消息的节点根据该查询结果判断该待查询的存储节点的关机状态。
例如,本发明实施例中,若该查询结果中节点状态标记为关机标记,可以说明所查询的存储节点为正常关机状态,并未发生故障;若该查询结果中节点状态标记为空,或为其他用于表征非正常关机的标记,可以说明查询的存储节点为非正常关机状态,即查询节点故障。
进一步地,在接入节点向存储节点发送写入请求后,若根据上述流程确定该存储节点为正常关机状态,管理节点还可以接收到接入节点发送的具有数据更新标记的标记消息。该标记消息中还包括待进行标记的存储节点的IP地址,管理节点获取该数据更新标记以及存储节点的IP地址后,可根据该IP地址查找到本地的全局关机信息中与其对应的关机消息,管理节点根据该标记消息对该关机消息添加数据更新标记。在后续接收到添加了数据更新标记的存储节点发送的开机消息时,通过向该存储节点回复具有该数据更新标记的更新消息,以通知该存储节点更新其存储的数据资源。
请参考图3,为本发明提供的数据资源复制方法的处理流程示意图,该数据资源复制方法可应用于基于Openstack Object Storage(swift)的云存储集群的Proxy接入节点,所述存储集群还包括Storage存储节点、Manager管理节点,该数据资源复制方法包括以下步骤:
步骤301,在分别向多个存储节点发送具有数据资源的写入请求后,若判断多个存储节点中的任意存储节点进行数据资源写入失败,将数据资源写入失败的存储节点作为故障节点;
当客户端需将数据资源写入swift云存储集群时,接入节点接收经由管理节点进行负载均衡后转发的具有数据资源的写入请求,并由接入节点根据预先指定的数据资源存储副本数,利用数据资源的名称和写入的逻辑空间名根据哈希算法计算出其在swift云存储集群中对应的多个物理存储节点,该多个物理存储节点的数量与该指定的数据资源存储副本数一致。之后,将接收的写入请求中的数据资源按其副本数生成对应数量的写入请求分别写到相等数量的物理存储节点上。
例如,指定的数据资源存储副本数为3,那么接入节点接收前端业务写入请求时,自动生成3份包含数据资源的写入请求分别发送至对应的3个存储节点,收到请求的3个存储节点将资源数据写入到对应的存储位置,并向接入节点返回处理结果。
如果,该计算出的3个存储节点运行正常,那么各存储节点则会将该数据资源成功写入到自身对应的位置后,并向接入节点回复写入成功的回应消息。接入节点在接收到该3个存储节点回复的写入成功的回应消息后,可以确定本次的数据资源写入成功,并向客户端返回写入成功的消息。
通常情况下,各存储节点均可以长时间的持续正常运行。但是,存储节点也会出现故障的情况,例如:
1、在需要对存储节点进行软件的更换或升级时,则需要对swift云存储集群中的存储节点逐一进行主动关机或主动重启的操作,此时,存储节点则会出现短时间的关机状态。该种情况通常是本发明上述的正常关机状态。
2、在存储节点出现软件功能损坏或死机等情况时,存储节点可能并未关机,但是相对于其他节点来说,由于接收不到该存储节点回应的消息,也认为该存储节点处于关机状态。该种情况通常是本发明上述的非正常关机状态。
因此,在向3个存储节点分别发送具有数据资源的写入请求后,如果有任意存储节点因上述情况处于关机状态,接入节点则不能接收到处于关机状态的存储节点回复的回应消息。
若接入节点在向3个存储节点发送具有数据资源的写入请求,并到达预设的超时时长后,未接收到3个存储节点中任意一个存储节点回复的回应消息,可以确定该未回复回应消息的存储节点为关机状态,并将该存储节点作为故障节点。
步骤302,向管理节点发送查询消息,以查询所述故障节点的关机状态;
本发明实施例中的管理节点保存有根据收集swift云存储集群中各存储节点的开、关机消息而建立的全局关机信息,该全局关机信息中包括正常关机的存储节点,即上述情况1中的存储节点。
接入节点可以将故障节点的IP地址作为故障节点的节点标识,携带在查询消息中发送至管理节点,以查询该全局关机信息中是否具有该故障节点的关机消息,并以此来判断该故障节点的关机状态。
步骤303,在接收到管理节点回复的应答消息后,根据管理节点回复的应答消息确定所述故障节点的关机状态为正常关机状态还是非正常关机状态,当确定所述关机状态为正常关机状态时,则不向备份节点发送所述写入请求,当确定所述关机状态为非正常关机状态时,将所述具有数据资源的写入请求发送至备份节点。
其中,该节点状态标记用于表征管理节点的全局关机信息中是否具有该故障节点的关机消息,若有,该节点状态标记可以是关机标记(例如,节点状态标记为1);否则该节点状态标记可以为空(例如,该节点状态标记为null),或者是其他用于表征非正常关机的标记(例如,该节点状态标记为0)。
接入节点在接收管理节点回复的具有节点状态标记的应答消息后,若该节点状态标记为关机标记,可以确定该故障节点为情况1中的正常关机状态。此时,为了避免因故障节点为短时间关机,在重启后需将写入备份节点上的数据资源再转移到恢复正常的存储节点的情况,本发明实施例并不重新选取备份节点并写入数据资源,而是向管理节点发送具有与该故障节点对应的标记消息,以使管理节点在节点数据库中将该故障节点添加数据更新标记,以记录该故障节点有数据资源需要更新。同时,向客户端发送写入成功的消息,以通知客户端本次数据资源写入已完成。这样一来,在故障节点开机并向管理节点发送开机消息后,若接收到管理节点发送的具有数据更新标记的标记消息,即可说明在故障节点关机过程中的数据资源有更新,那么故障节点可以自动将该数据资源写入自身指定的位置,避免了在写入数据资源时,因存储节点的正常关机,而将数据资源大量写入备份节点,并在存储节点开机时,再将写入备份节点的数据资源转移到开机的存储节点的情况,进而提高swift云存储集群的可靠性以及可用性。
然而,接入节点在接收管理节点回复的具有节点状态标记的应答消息后,若该节点状态标记为空或其他用于表征非正常关机的标记,说明管理节点的全局关机信息中并未有该故障节点的关机消息,可以确定该故障节点为上述情况2中的非正常关机状态。此时,接入节点可以选取出备份节点,并将具有数据资源的写入请求发送至该备份节点,以使备份节点将该数据资源写入备份节点的指定位置。接入节点在接收到该备份节点回复的写入成功消息后,确定该数据资源写入成功,并向客户端发送写入成功的消息,以通知客户端本次数据资源写入已完成。同时,还可以向swift云存储集群管理员发送告警通知,提醒swift云存储集群管理员,该存储节点可能故障。
请参考图4,为本发明提供的数据资源复制方法的处理流程示意图,该数据资源复制方法可应用基于Openstack Object Storage(swift)的云存储集群的Storage存储节点,所述存储集群还包括Proxy接入节点、Manager管理节点,该数据资源复制方法包括以下步骤:
步骤401,定期向存储有自身保存的数据资源的副本的其他存储节点发送审核消息,以检查本地存储的数据资源与保存至其他存储节点的副本内容是否一致;
本发明实施例中,存储节点在接收到的接入节点发送的具有数据资源的写入请求,并将数据资源存储后,还可以通过定期向存储有与自身存储的数据资源一致的存储节点发送审核消息,来审核本地存储的数据资源与存储至其他存储节点的数据资源副本的内容是否一致。
如果在本地存储节点向其他存储节点发送了审核消息后,接收到该其他存储节点回复的携带有校验和的回应消息,本地存储节点可以根据该校验和来校验该其他存储节点存储的数据资源副本与本地存储节点的数据资源内容是否一致,若一致,确定此次数据资源审核通过,则不进行处理,若不一致,确定此次数据资源审核未通过,则修复本地存储节点存储的数据资源。
步骤402,若在预设超时时间未接收到所述其他存储节点中任意存储节点回复的回应消息,将未回复回应消息的存储节点作为故障节点,并向管理节点发送查询消息,以查询所述故障节点的关机状态;
如果在本地存储节点向其他存储节点发送了审核消息,并到达预设的超时时长后,仍未接收到其他存储节点中任意存储节点回复的回应消息,可以确定未回复回应消息的存储节点为关机状态,并将其作为故障节点。
之后,本地存储节点可以将故障节点的IP地址作为故障节点的节点标识,携带在查询消息中发送至管理节点,以查询该全局关机信息中是否具有该故障节点的关机消息,并以此来判断该故障节点的关机状态。
步骤403,接收管理节点回复的具有节点状态标记的应答消息,若根据所述节点状态标记确定所述故障节点为非正常关机状态,将本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点,若根据所述应答消息确定所述故障节点为正常关机状态,则不会将所述本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点。
存储节点在接收到管理节点回复的具有节点状态标记的应答消息后,可以根据该节点状态标记来获知故障节点是正常关机状态还是非正常关机状态。
若管理节点的全局关机信息中具有该故障节点的关机消息,该应答消息中的节点状态标记可以是关机标记(例如,节点状态标记为1),可以确定该故障节点为本发明上述的情况1中的正常关机状态。此时,为了避免将存入该正常关机状态的故障节点中的数据资源再转移到备份节点的情况发生,本发明实施例并不会如现有技术中重新选取备份节点并写入数据资源,而是默认为该次数据资源审核通过。由此,可有效避免了现有技术中因存储节点正常关机,而将数据资源大量转移至备份节点的步骤,进而提高swift云存储集群的可靠性以及可用性。
然而,若管理节点的全局关机信息中不具有该故障节点的关机消息,该节点状态标记可以为空(例如,该节点状态标记为null),或者是其他用于表征非正常关机的标记(例如,该节点状态标记为0)。存储节点在根据节点状态标记确定该故障节点为本发明上述的情况2中的非正常关机状态,例如该故障节点已故障时,可以重新选取出备份节点,并将本地存储节点上与故障节点对应的数据资源副本写入备份节点,以保证swift云存储集群中多份复制机制的运行正常。
进一步地,本发明实施例中的存储节点在开机以及正常关机时可以分别向管理节点发送开、关机消息,以通知管理节点更新其全局关机信息。若本地存储节点为故障节点,在本地存储节点开机时,可向管理节点发送开机消息,若接收到管理节点发送的具有数据更新标记的更新消息,说明在本地存储节点关机过程中,存储的数据资源有更新,即,有新的数据资源要写入本地存储节点。那么本地存储节点可以根据该数据更新标记获取对应的数据资源,并写入本地存储节点。
本发明还提供了一种数据资源复制装置,图5为该数据资源复制装置的结构示意图,该装置可以应用在基于Openstack Object Storage(swift)的云存储集群的Manager管理节点,所述存储集群还包括Proxy接入节点、Storage存储节点,该数据资源复制装置可以包括保存单元501、获取单元502、检查单元503以及发送单元504,其中:
保存单元501,用于接收存储节点发送的关机消息,将所述存储节点的关机消息保存至全局关机信息中;
获取单元502,用于在接收到查询存储节点关机状态的查询消息后,获取所述查询消息中携带的存储节点的节点标识;
检查单元503,用于检查预存的全局关机信息中是否有与所述存储节点的节点标识对应的存储节点的关机消息,并得到查询结果;
发送单元504,用于根据所述查询结果回复携带有节点状态标记的应答消息,以使发送所述查询消息的节点根据所述节点状态标记判断所述存储节点的关机状态。
进一步地,所述保存单元501还用于记录接收到所述存储节点的关机消息的时间;
进一步地,所述装置还包括删除单元505,用于当接收所述关机消息后的时间到达预设容忍时间之前,接收到所述存储节点的开机消息,确定所述存储节点已开机,将所述存储节点从所述全局关机信息中删除;当接收所述关机消息后的时间到达预设容忍时间时,未接收到所述存储节点的开机消息,确定所述存储节点为非正常关机状态,将所述存储节点从所述全局关机信息中删除。
进一步地,所述获取单元502还可以用于若接收到接入节点发送的标记消息,获取所述标记消息中的存储节点的节点标识以及数据更新标记;所述检查单元502还用于查找本地的全局关机信息中与所述存储节点的节点标识对应的关机消息;
进一步地,所述装置还包括标记单元506用于对所述对应的关机消息添加数据更新标记;所述发送单元503还用于在接收到具有数据更新标记的存储节点发送的开机消息时,回复具有所述数据更新标记的更新消息,以通知所述存储节点更新其存储的数据资源。
另外,本发明应用于管理节点的数据资源复制装置在具体的处理流程中可以与上述应用于管理节点的数据资源复制方法的处理流程一致,在此不再赘述。
本发明还提供了一种数据资源复制装置,图6为该数据资源复制装置的结构示意图,该装置可以应用在基于Openstack Object Storage(swift)的云存储集群的Proxy接入节点,所述存储集群还包括Manager管理节点、Storage存储节点,该数据资源复制装置可以包括判断单元601、发送单元602以及确定单元603,其中:
判断单元601,用于在分别向多个存储节点发送具有数据资源的写入请求后,若判断多个存储节点中的任意存储节点进行数据资源写入失败,将数据资源写入失败的存储节点作为故障节点;
发送单元602,用于向管理节点发送查询消息,以查询所述故障节点的关机状态;
确定单元603,用于在接收到管理节点回复的应答消息后,根据管理节点回复的应答消息确定所述故障节点的关机状态为正常关机状态还是非正常关机状态,当确定所述关机状态为正常关机状态时,则不向备份节点发送所述写入请求,当确定所述关机状态为非正常关机状态时,将所述具有数据资源的写入请求发送至备份节点。
进一步地,所述确定单元603还用于当确定所述关机状态为正常关机状态时,向所述管理节点发送携带有与所述故障节点对应的数据更新标记的标记消息,以使所述故障节点在开机后获取所述数据资源,并使用所述数据资源同步更新其保存的数据资源。
另外,本发明应用于接入节点的数据资源复制装置在具体的处理流程中可以与上述应用于接入节点的数据资源复制方法的处理流程一致,在此不再赘述。
本发明还提供了一种数据资源复制装置,图7为该数据资源复制装置的结构示意图,该装置可以应用在基于Openstack Object Storage(swift)的云存储集群的Storage存储节点,所述存储集群还包括Proxy接入节点、Manager管理节点,该数据资源复制装置可以包括审核单元701、发送单元702以及接收单元703,其中:
审核单元701,用于定期向存储有自身保存的数据资源的副本的其他存储节点发送审核消息,以检查本地存储的数据资源与保存至其他存储节点的副本内容是否一致;
发送单元702,用于在预设超时时间未接收到所述其他存储节点中任意存储节点回复的回应消息,将未回复回应消息的存储节点作为故障节点,并向管理节点发送具有所述故障节点的查询消息;
接收单元703,用于接收管理节点回复的具有节点状态标记的应答消息,若根据所述节点状态标记确定所述故障节点为非正常关机状态,将本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点,若根据所述应答消息确定所述故障节点为正常关机状态,则不会将所述本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点。
进一步地,所述发送单元702还可以用于在确定存储节点正常关机时,向管理节点发送关机消息,所述关机消息携带所述存储节点的节点标识,以供所述管理节点存储所述关机消息;若所述本地存储节点为故障节点,在所述本地存储节点开机后,向管理节点发送开机消息;
进一步地,所述装置还可以包括更新单元704,用于在接收到管理节点发送的具有数据更新标记的更新消息时,根据所述数据更新标记更新本地存储节点存储的数据资源。
另外,本发明应用于本地存储节点的数据资源复制装置在具体的处理流程中可以与上述用于本地存储节点的数据资源复制方法的处理流程一致,在此不再赘述。
上述装置可以通过软件实现,也可以通过硬件实现,为示例方便,本发明数据资源复制装置所在的管理节点、接入节点以及存储节点的硬件架构示意图均可参考图8所示,其基本硬件环境包括中央处理器CPU、转发芯片、存储器以及其他硬件,其中存储器件中包括机器可读指令,CPU读取并执行机器可读指令执行图5、6以及7中各单元的功能。
从以上各种方法和装置的实施方式中可以看出,本发明提供的数据资源复制方法以及装置,在分别向多个存储节点发送写入请求后,若存在数据资源写入失败的故障节点,查询该故障节点的关机状态,并在确定该故障节点的关机状态为正常关机状态时,向管理节点发送与故障节点对应的数据更新标记,以使故障节点在开机后将所述数据资源写入所述故障节点。避免了在写入数据资源时,因存储节点的正常关机,而将数据资源大量写入备份节点,并在存储节点开机时,再将写入备份节点的数据资源转移到开机的存储节点的情况。还有效避免了在审核数据资源时,由于存储节点的正常关机,而将数据资源大量转移至备份节点的情况,进而提高swift云存储集群的可靠性以及可用性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (14)

1.一种数据资源复制方法,应用于基于Openstack Object Storage(swift)的云存储集群的Proxy接入节点,所述存储集群还包括Manager管理节点、Storage存储节点,其特征在于,所述方法包括:
在分别向多个存储节点发送具有数据资源的写入请求后,若判断多个存储节点中的任意存储节点进行数据资源写入失败,将数据资源写入失败的存储节点作为故障节点;
向管理节点发送查询消息,以查询所述故障节点的关机状态;
在接收到管理节点回复的应答消息后,根据管理节点回复的应答消息确定所述故障节点的关机状态为正常关机状态还是非正常关机状态,当确定所述关机状态为正常关机状态时,则不向备份节点发送所述写入请求,当确定所述关机状态为非正常关机状态时,将所述具有数据资源的写入请求发送至备份节点。
2.如权利要求1所述的方法,其特征在于,在确定所述关机状态为正常关机状态后,所述方法还包括:
向所述管理节点发送携带有与所述故障节点对应的数据更新标记的标记消息,以使所述故障节点在开机后获取所述数据资源,并使用所述数据资源同步更新其保存的数据资源。
3.一种数据资源复制方法,应用于基于Openstack Object Storage(swift)的云存储集群的Manager管理节点,所述存储集群还包括Proxy接入节点、Storage存储节点,其特征在于,所述方法包括:
接收存储节点发送的关机消息,将所述存储节点的关机消息保存至全局关机信息中;
在接收到查询存储节点关机状态的查询消息后,获取所述查询消息中携带的存储节点的节点标识;
检查所述全局关机信息中是否有与所述存储节点的节点标识对应的存储节点的关机消息,并得到查询结果;
根据所述查询结果回复应答消息,以使发送所述查询消息的节点根据所述查询结果判断所述存储节点的关机状态。
4.如权利要求3所述的方法,其特征在于,接收存储节点发送的关机消息之后,所述方法还包括:
记录接收到所述存储节点的关机消息的时间;
当接收所述关机消息后的时间到达预设容忍时间之前,接收到所述存储节点的开机消息,确定所述存储节点已开机,将所述存储节点从所述全局关机信息中删除;
当接收所述关机消息后的时间到达预设容忍时间时,未接收到所述存储节点的开机消息,确定所述存储节点为非正常关机状态,将所述存储节点从所述全局关机信息中删除。
5.如权利要求3所述的方法,其特征在于,所述方法还包括:
若接收到接入节点发送的标记消息,获取所述标记消息中的存储节点的节点标识以及数据更新标记;
查找本地预存的全局关机信息中与所述存储节点的节点标识对应的关机消息;
对所述对应的关机消息添加数据更新标记;
在接收到具有数据更新标记的存储节点发送的开机消息时,回复具有所述数据更新标记的更新消息,以通知所述存储节点更新其存储的数据资源。
6.一种数据资源复制方法,应用于基于Openstack Object Storage(swift)的云存储集群的Storage存储节点,所述存储集群还包括Proxy接入节点、Manager管理节点,其特征在于,所述方法包括:
定期向存储有自身保存的数据资源的副本的其他存储节点发送审核消息,以检查本地存储的数据资源与保存至其他存储节点的副本内容是否一致;
若在预设超时时间未接收到所述其他存储节点中任意存储节点回复的回应消息,将未回复回应消息的存储节点作为故障节点,并向管理节点发送查询消息,以查询所述故障节点的关机状态;
接收管理节点回复的应答消息,若根据所述应答消息确定所述故障节点为非正常关机状态,将所述本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点,若根据所述应答消息确定所述故障节点为正常关机状态,则不会将所述本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:
存储节点正常关机时,向管理节点发送关机消息,所述关机消息携带所述存储节点的节点标识,以供所述管理节点存储所述关机消息;
若所述存储节点为故障节点,在所述存储节点开机后,向管理节点发送开机消息;
若接收到管理节点发送的具有数据更新标记的更新消息,根据所述数据更新标记更新所述存储节点存储的数据资源。
8.一种数据资源复制装置,应用于基于Openstack Object Storage(swift)的云存储集群的Proxy接入节点,所述存储集群还包括Manager管理节点、Storage存储节点,其特征在于,所述装置包括:
判断单元,用于在分别向多个存储节点发送具有数据资源的写入请求后,若判断多个存储节点中的任意存储节点进行数据资源写入失败,将数据资源写入失败的存储节点作为故障节点;
发送单元,用于向管理节点发送查询消息,以查询所述故障节点的关机状态;
确定单元,用于在接收到管理节点回复的应答消息后,根据管理节点回复的应答消息确定所述故障节点的关机状态为正常关机状态还是非正常关机状态,当确定所述关机状态为正常关机状态时,则不向备份节点发送所述写入请求,当确定所述关机状态为非正常关机状态时,将所述具有数据资源的写入请求发送至备份节点。
9.如权利要求8所述的装置,其特征在于,所述确定单元还用于:
当确定所述关机状态为正常关机状态时,向所述管理节点发送携带有与所述故障节点对应的数据更新标记的标记消息,以使所述故障节点在开机后获取所述数据资源,并使用所述数据资源同步更新其保存的数据资源。
10.一种数据资源复制装置,应用于基于Openstack Object Storage(swift)的云存储集群的Manager管理节点,所述存储集群还包括Proxy接入节点、Storage存储节点,其特征在于,所述装置包括:
保存单元,用于接收存储节点发送的关机消息,将所述存储节点的关机消息保存至全局关机信息中;
获取单元,用于在接收到查询存储节点关机状态的查询消息后,获取所述查询消息中携带的存储节点的节点标识;
检查单元,用于检查预存的全局关机信息中是否有与所述存储节点的节点标识对应的存储节点的关机消息,并得到查询结果;
发送单元,用于根据所述查询结果回复携带有节点状态标记的应答消息,以使发送所述查询消息的节点根据所述节点状态标记判断所述存储节点的关机状态。
11.如权利要求10所述的装置,其特征在于,所述保存单元还用于:
记录接收到所述存储节点的关机消息的时间;
所述装置还包括删除单元,
用于当接收所述关机消息后的时间到达预设容忍时间之前,接收到所述存储节点的开机消息,确定所述存储节点已开机,将所述存储节点从所述全局关机信息中删除;当接收所述关机消息后的时间到达预设容忍时间时,未接收到所述存储节点的开机消息,确定所述存储节点为非正常关机状态,将所述存储节点从所述全局关机信息中删除。
12.如权利要求10所述的装置,其特征在于,所述获取单元还用于:
若接收到接入节点发送的标记消息,获取所述标记消息中的存储节点的节点标识以及数据更新标记;
所述检查单元还用于:
查找本地预存的全局关机信息中与所述存储节点的节点标识对应的关机消息;
所述装置还包括标记单元,
用于对所述对应的关机消息添加数据更新标记;
所述发送单元还用于:
在接收到具有数据更新标记的存储节点发送的开机消息时,回复具有所述数据更新标记的更新消息,以通知所述存储节点更新其存储的数据资源。
13.一种数据资源复制装置,应用于基于Openstack Object Storage(swift)的云存储集群的Storage存储节点,所述存储集群还包括Proxy接入节点、Manager管理节点,其特征在于,所述装置包括:
审核单元,用于定期向存储有自身保存的数据资源的副本的其他存储节点发送审核消息,以检查本地存储的数据资源与保存至其他存储节点的副本内容是否一致;
发送单元,用于在预设超时时间未接收到所述其他存储节点中任意存储节点回复的回应消息,将未回复回应消息的存储节点作为故障节点,并向管理节点发送具有所述故障节点的查询消息,以查询所述故障节点的关机状态;
接收单元,用于接收管理节点回复的具有节点状态标记的应答消息,若根据所述节点状态标记确定所述故障节点为非正常关机状态,将本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点,若根据所述应答消息确定所述故障节点为正常关机状态,则不会将所述本地存储的数据资源中与所述故障节点对应的数据资源写入备份节点。
14.如权利要求13所述的装置,其特征在于,所述发送单元还用于:
存储节点正常关机时,向管理节点发送关机消息,所述关机消息携带所述存储节点的节点标识,以供所述管理节点存储所述关机消息;
若所述本地存储节点为故障节点,在所述本地存储节点开机后,向管理节点发送开机消息;
所述装置还包括更新单元,
用于在接收到管理节点发送的具有数据更新标记的更新消息时,根据所述数据更新标记更新本地存储节点存储的数据资源。
CN201510098052.1A 2015-03-05 2015-03-05 数据资源复制方法以及装置 Active CN104679611B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510098052.1A CN104679611B (zh) 2015-03-05 2015-03-05 数据资源复制方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510098052.1A CN104679611B (zh) 2015-03-05 2015-03-05 数据资源复制方法以及装置

Publications (2)

Publication Number Publication Date
CN104679611A true CN104679611A (zh) 2015-06-03
CN104679611B CN104679611B (zh) 2018-03-09

Family

ID=53314701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510098052.1A Active CN104679611B (zh) 2015-03-05 2015-03-05 数据资源复制方法以及装置

Country Status (1)

Country Link
CN (1) CN104679611B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105657064A (zh) * 2016-03-24 2016-06-08 东南大学 基于虚拟节点存储优化的Swift负载均衡方法
CN106528574A (zh) * 2015-09-14 2017-03-22 阿里巴巴集团控股有限公司 一种数据同步方法及设备
CN107092437A (zh) * 2016-02-17 2017-08-25 杭州海康威视数字技术股份有限公司 数据写入、读取方法及装置、云存储系统
CN107239383A (zh) * 2017-06-28 2017-10-10 郑州云海信息技术有限公司 一种OpenStack虚拟机的故障监控方法及装置
WO2019144555A1 (zh) * 2018-01-24 2019-08-01 平安科技(深圳)有限公司 容灾数据的在线同步装置、方法及计算机可读存储介质
CN110096285A (zh) * 2019-04-29 2019-08-06 杭州数梦工场科技有限公司 软件系统的部署方法、装置、计算机设备及存储介质
CN110515669A (zh) * 2019-08-30 2019-11-29 苏州浪潮智能科技有限公司 一种数据管理方法、装置及电子设备和存储介质
WO2020034866A1 (zh) * 2018-08-13 2020-02-20 杭州复杂美科技有限公司 一种故障节点检测方法及系统、设备和可存储介质
CN110868564A (zh) * 2018-08-28 2020-03-06 杭州海康威视系统技术有限公司 一种存储任务分配方法、云存储系统及电子设备
CN111240899A (zh) * 2020-01-10 2020-06-05 北京百度网讯科技有限公司 状态机复制方法、装置、系统及存储介质
CN111552701A (zh) * 2020-04-30 2020-08-18 中国建设银行股份有限公司 确定分布式集群中数据一致性的方法及分布式数据系统
CN112214466A (zh) * 2019-07-12 2021-01-12 海能达通信股份有限公司 分布式集群系统及数据写入方法、电子设备、存储装置
CN113535464A (zh) * 2020-04-17 2021-10-22 海能达通信股份有限公司 一种容灾备份方法、服务器、集群系统和存储装置
CN114697353A (zh) * 2022-05-27 2022-07-01 邹平市供电有限公司 一种分布式存储集群电网数据存储控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1460210A (zh) * 2001-04-25 2003-12-03 成津C&C株式会社 防止计算机操作系统损坏的装置和方法
US20130061232A1 (en) * 2011-09-02 2013-03-07 Ilt Innovations Ab Method And Device For Maintaining Data In A Data Storage System Comprising A Plurality Of Data Storage Nodes
CN103401917A (zh) * 2013-07-29 2013-11-20 华南理工大学 一种基于云总线的混合云计算系统及其实现方法
CN104035907A (zh) * 2013-03-08 2014-09-10 纬创资通股份有限公司 用于计算机系统的备份方法和计算机系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1460210A (zh) * 2001-04-25 2003-12-03 成津C&C株式会社 防止计算机操作系统损坏的装置和方法
US20130061232A1 (en) * 2011-09-02 2013-03-07 Ilt Innovations Ab Method And Device For Maintaining Data In A Data Storage System Comprising A Plurality Of Data Storage Nodes
CN104035907A (zh) * 2013-03-08 2014-09-10 纬创资通股份有限公司 用于计算机系统的备份方法和计算机系统
CN103401917A (zh) * 2013-07-29 2013-11-20 华南理工大学 一种基于云总线的混合云计算系统及其实现方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528574A (zh) * 2015-09-14 2017-03-22 阿里巴巴集团控股有限公司 一种数据同步方法及设备
CN107092437A (zh) * 2016-02-17 2017-08-25 杭州海康威视数字技术股份有限公司 数据写入、读取方法及装置、云存储系统
US11586673B2 (en) 2016-02-17 2023-02-21 Hangzhou Hikvision Digital Technology Co., Ltd. Data writing and reading method and apparatus, and cloud storage system
CN107092437B (zh) * 2016-02-17 2019-11-22 杭州海康威视数字技术股份有限公司 数据写入、读取方法及装置、云存储系统
CN105657064B (zh) * 2016-03-24 2019-03-12 东南大学 基于虚拟节点存储优化的Swift负载均衡方法
CN105657064A (zh) * 2016-03-24 2016-06-08 东南大学 基于虚拟节点存储优化的Swift负载均衡方法
CN107239383A (zh) * 2017-06-28 2017-10-10 郑州云海信息技术有限公司 一种OpenStack虚拟机的故障监控方法及装置
WO2019144555A1 (zh) * 2018-01-24 2019-08-01 平安科技(深圳)有限公司 容灾数据的在线同步装置、方法及计算机可读存储介质
WO2020034866A1 (zh) * 2018-08-13 2020-02-20 杭州复杂美科技有限公司 一种故障节点检测方法及系统、设备和可存储介质
CN110868564A (zh) * 2018-08-28 2020-03-06 杭州海康威视系统技术有限公司 一种存储任务分配方法、云存储系统及电子设备
CN110868564B (zh) * 2018-08-28 2021-06-04 杭州海康威视系统技术有限公司 一种存储任务分配方法、云存储系统及电子设备
CN110096285A (zh) * 2019-04-29 2019-08-06 杭州数梦工场科技有限公司 软件系统的部署方法、装置、计算机设备及存储介质
CN112214466A (zh) * 2019-07-12 2021-01-12 海能达通信股份有限公司 分布式集群系统及数据写入方法、电子设备、存储装置
CN110515669A (zh) * 2019-08-30 2019-11-29 苏州浪潮智能科技有限公司 一种数据管理方法、装置及电子设备和存储介质
CN110515669B (zh) * 2019-08-30 2022-07-08 苏州浪潮智能科技有限公司 一种数据管理方法、装置及电子设备和存储介质
CN111240899A (zh) * 2020-01-10 2020-06-05 北京百度网讯科技有限公司 状态机复制方法、装置、系统及存储介质
CN113535464A (zh) * 2020-04-17 2021-10-22 海能达通信股份有限公司 一种容灾备份方法、服务器、集群系统和存储装置
CN113535464B (zh) * 2020-04-17 2024-02-02 海能达通信股份有限公司 一种容灾备份方法、服务器、集群系统和存储装置
CN111552701A (zh) * 2020-04-30 2020-08-18 中国建设银行股份有限公司 确定分布式集群中数据一致性的方法及分布式数据系统
CN111552701B (zh) * 2020-04-30 2023-07-21 中国建设银行股份有限公司 确定分布式集群中数据一致性的方法及分布式数据系统
CN114697353A (zh) * 2022-05-27 2022-07-01 邹平市供电有限公司 一种分布式存储集群电网数据存储控制方法
CN114697353B (zh) * 2022-05-27 2022-09-06 邹平市供电有限公司 一种分布式存储集群电网数据存储控制方法

Also Published As

Publication number Publication date
CN104679611B (zh) 2018-03-09

Similar Documents

Publication Publication Date Title
CN104679611A (zh) 数据资源复制方法以及装置
US9170892B2 (en) Server failure recovery
US9262324B2 (en) Efficient distributed cache consistency
US9753954B2 (en) Data node fencing in a distributed file system
CN106933547B (zh) 全局信息获取及处理的方法、装置和更新系统
CN103248725A (zh) 一种安全可靠的域名解析修复方法和系统
CN104219085A (zh) 一种数据库的数据处理方法、代理服务器及系统
CN104504062A (zh) 主备数据库数据同步方法及装置
CN105550229A (zh) 分布式存储系统数据修复的方法和装置
CN107015884B (zh) 一种数据存储方法及装置
CN106506490A (zh) 一种分布式计算控制方法以及分布式计算系统
CN105912422A (zh) 数据备份方法、备份客户端与数据备份系统
CN104486125A (zh) 配置文件的备份方法及装置
RU2643642C2 (ru) Использование кэш-памяти и памяти другого типа в распределённой запоминающей системе
US11281446B2 (en) Updating method, terminal and electronic device
EP3896571B1 (en) Data backup method, apparatus and system
CN108509296B (zh) 一种处理设备故障的方法和系统
CN105323271B (zh) 一种云计算系统以及云计算系统的处理方法和装置
CN107864209B (zh) 数据写入的方法、装置及服务器
US8447833B2 (en) Reading and writing during cluster growth phase
CN103530205A (zh) 多副本中故障副本的处理方法和装置
CN112035062A (zh) 云计算的本地存储的迁移方法、计算机设备及存储介质
CN113010600B (zh) 一种基于区块链的数据管理系统、方法、相关设备及介质
CN113590049B (zh) 一种存储卷跨节点克隆的方法、装置、设备及可读介质
CN113391759B (zh) 一种通信方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant