CN108959390A - 共享文件系统节点故障后的资源区同步方法及装置 - Google Patents

共享文件系统节点故障后的资源区同步方法及装置 Download PDF

Info

Publication number
CN108959390A
CN108959390A CN201810555356.XA CN201810555356A CN108959390A CN 108959390 A CN108959390 A CN 108959390A CN 201810555356 A CN201810555356 A CN 201810555356A CN 108959390 A CN108959390 A CN 108959390A
Authority
CN
China
Prior art keywords
node
sync
area
space
shared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810555356.XA
Other languages
English (en)
Other versions
CN108959390B (zh
Inventor
葛长伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Cloud Technologies Co Ltd
Original Assignee
New H3C Cloud Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Cloud Technologies Co Ltd filed Critical New H3C Cloud Technologies Co Ltd
Priority to CN201810555356.XA priority Critical patent/CN108959390B/zh
Publication of CN108959390A publication Critical patent/CN108959390A/zh
Application granted granted Critical
Publication of CN108959390B publication Critical patent/CN108959390B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本申请提供一种共享文件系统节点故障后的资源区同步方法及装置。所述方法应用于共享文件系统中的节点,各节点共享访问所述共享文件系统中用于存储元数据的共享存储空间,每一节点在所述共享存储空间上具有独占的日志区和空间分配器区,包括:所述共享文件系统中的非故障节点检测到故障节点,查询所述共享存储空间上所述故障节点对应的资源区是否设置有同步标识,所述资源区包括日志区和空间分配器区,所述同步标识表征对所述故障节点进行同步;若没有,为所述故障节点对应的资源区设置所述同步标识;回放所述日志区中的日志,以及,回收所述空间分配器区中的空间。如此,可提升共享文件系统的可靠性。

Description

共享文件系统节点故障后的资源区同步方法及装置
技术领域
本申请涉及共享文件系统同步技术领域,具体而言,涉及一种共享文件系统节点故障后的资源区同步方法及装置。
背景技术
共享文件系统是指由多个节点组成的集群,是格式化在存储空间,例如,磁盘逻辑单元号(LUN,Logical Unit Number)上,用以供多个节点同时安全访问的一种文件系统。任一节点在存储空间上读写文件,其他节点可通过分布式锁管理器(DLM,Distributed LockManager)协商读写权限,使得写级别的分布式锁在集群中只存在一个,以维持不同节点间的互斥域,用以同步不同节点访问磁盘LUN,保障数据并发访问的安全性。
当共享文件系统中某个节点访问磁盘LUN出现故障,例如,由于该节点到磁盘LUN的网络故障,或者,由于该节点的主机总线适配器(HBA,Host Bus Adapter)卡故障,或者,该节点与其它节点的网络消息无法交互时,该节点成为故障节点,为了避免故障节点影响共享文件系统的正常运行,需要移除故障节点并回收其占用的资源。由于共享文件系统中每个节点都在共享磁盘LUN上具有独占的日志区和空间分配器区,其中,空间分配器区预先从全局空间分配器区中预留空间,因而,在出现故障节点后,需要由其他非故障节点对该故障节点在共享磁盘LUN上的日志区和空间分配器区进行同步处理,以回收为该故障节点配置的资源以及保障共享文件系统元数据的一致性,包括:将该故障节点的空间分配器区中的预留空间回收至全局空间分配器区,以及,对日志区中的日志进行回放,以保障共享文件系统元数据的一致性,例如,依据日志添加故障节点在发生故障时对共享文件没执行完的文件操作。但该同步故障节点的方法,由于故障节点无法和其他节点通信,使得不同节点间分布式锁的互斥域可能不一致,从而导致共享文件系统中,多个节点可能持有写级别的分布式锁,引起多个节点对故障节点进行同步,即多个节点都对故障节点进行日志回放以及预留空间回收,从而可能造成共享文件系统元数据不一致或遭到破坏,使得共享文件系统的可靠性降低;例如,若多个节点都对故障节点进行日志回放,会使得共享文件系统元数据不一致或遭到破坏。
发明内容
第一方面,本申请实施例提供一种共享文件系统节点故障后的资源区同步方法,应用于共享文件系统中的节点,各节点共享访问所述共享文件系统中用于存储元数据的共享存储空间,每一节点在所述共享存储空间上具有独占的日志区和空间分配器区,所述方法包括:
所述共享文件系统中的非故障节点检测到故障节点,查询所述共享存储空间上所述故障节点对应的资源区是否设置有同步标识,所述资源区包括日志区和空间分配器区,所述同步标识表征对所述故障节点进行同步;
若没有设置有同步标识,为所述故障节点对应的资源区设置所述同步标识;
回放所述日志区中的日志,以及,回收所述空间分配器区中的空间。
第二方面,本申请实施例提供一种共享文件系统节点故障后的资源区同步装置,应用于共享文件系统的节点,各节点共享访问所述共享文件系统中用于存储元数据的共享存储空间,每一节点在所述共享存储空间上具有独占的日志区和空间分配器区,所述装置包括:
同步标识查询模块,用于检测到故障节点,查询所述共享存储空间上所述故障节点对应的资源区是否设置有同步标识,所述资源区包括日志区和空间分配器区,所述同步标识表征对所述故障节点进行同步;
同步标识设置模块,若确认没有设置同步标识,为所述故障节点对应的资源区设置所述同步标识;
同步模块,用于回放所述日志区中的日志,以及,回收所述空间分配器区中的空间。
第三方面,本申请实施例提供一种计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的方法的步骤。
相对于现有技术而言,本申请具有以下有益效果:
本申请提供的共享文件系统节点故障后的资源区同步方法及装置,在确认节点发生故障后,确认节点发生故障的节点通过查询故障节点在共享存储空间上的资源区是否设置有同步标识,若未设置有同步标识,表示还未有其它节点对该故障节点执行同步,因而,为该故障节点对应的资源区设置同步标识后,回放故障节点对应的日志区中的日志,以及,回收空间分配器区中的空间,从而通过设置同步标识的方式实现不同节点间分布式锁互斥域的一致,避免了多个节点同时对故障节点进行同步从而导致共享文件系统元数据不一致或遭到破坏的技术问题,提升了共享文件系统的可靠性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的共享文件系统节点故障后的资源区同步方法流程示意图;
图2为本申请实施例提供的检测到故障节点的流程示意图;
图3为本申请实施例提供的共享文件系统节点故障后的资源区同步方法另一流程示意图;
图4为本申请实施例提供的共享文件系统节点故障后的资源区同步装置的结构示意图;
图5为本申请实施例提供的计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
图1为本申请实施例提供的共享文件系统节点故障后的资源区同步方法流程示意图。应用于共享文件系统中的节点,各节点共享访问所述共享文件系统中用于存储元数据的共享存储空间,每一节点在所述共享存储空间上具有独占的日志区和空间分配器区,如图1所示,该流程包括:
步骤101,所述共享文件系统中的非故障节点检测到故障节点,查询所述共享存储空间上所述故障节点对应的资源区是否设置有同步标识,所述资源区包括日志区和空间分配器区,所述同步标识表征对所述故障节点进行同步;
本实施例中,作为一可选实施例,存储空间包括:磁盘逻辑单元号、硬盘、存储卡等。
本实施例中,共享存储空间上还存储有供各节点访问的共享文件,各节点通过日志维护共享文件系统中共享文件元数据的一致性。其中,作为一可选实施例,可以通过块存储、文件存储、对象存储等方式存储共享文件。
步骤102,若没有设置同步标识,为所述故障节点对应的资源区设置所述同步标识;
步骤103,回放所述日志区中的日志,以及,回收所述空间分配器区中的空间。
本实施例中,作为一可选实施例,在回放日志区中的日志后,使得共享文件系统中元数据保持一致,再执行回收空间分配器区中的空间的流程。
本实施例中,在确认节点发生故障后,确认节点发生故障的节点(共享文件系统中的非故障节点)启动对该故障节点的同步流程,通过查询故障节点在共享存储空间上的资源区是否设置有同步标识,若未设置有同步标识,表示还未有其它节点对该故障节点执行同步,因而,为该故障节点对应的资源区设置同步标识后,回放该故障节点对应的日志区中的日志,以及,回收空间分配器区中的空间。从而通过设置同步标识的方式实现不同节点间分布式锁互斥域的一致,只有为故障节点设置同步标识的节点对故障节点进行同步,避免多个节点同时对故障节点均进行同步从而导致共享文件系统元数据不一致或遭到破坏的技术问题,提升了共享文件系统的可靠性。
本实施例中,作为一可选实施例,图2为本申请实施例提供的检测到故障节点的流程示意图。如图2所示,该流程包括:
步骤201,周期性从共享文件系统中的目标节点获取所述目标节点的故障检测心跳;
本实施例中,作为一可选实施例,各节点通过周期性读写故障检测心跳维持同其他节点的通信,若节点具有故障检测心跳,表明该节点运行正常,若节点故障检测心跳停止,表明该节点发生故障。
本实施例中,作为一可选实施例,故障检测心跳为一按照预设的心跳递增周期递增的故障检测心跳序列,例如,以5秒为心跳递增周期形成递增故障检测心跳序列。作为一可选实施例,周期性获取故障检测心跳的心跳检测周期大于或等于心跳递增周期。
步骤202,比对获取的所述目标节点的故障检测心跳与上一周期该目标节点的故障检测心跳;
本实施例中,作为一可选实施例,对目标节点当前周期的递增故障检测心跳序列和上一周期的递增故障检测心跳序列进行比对,以确定目标节点的故障检测心跳是否正常。
步骤203,若比对结果为相同,确定所述目标节点为故障节点。
本实施例中,作为一可选实施例,若目标节点当前周期的递增故障检测心跳序列为(1,2,3,4,5),上一周期的递增故障检测心跳序列为(1,2,3,4,5);或者,若目标节点当前周期的递增故障检测心跳序列为(5),上一周期的递增故障检测心跳序列为(5),表明目标节点的故障检测心跳停止,该节点发生故障。若目标节点当前周期的递增故障检测心跳序列为(1,2,3,4),上一周期的递增故障检测心跳序列为(1,2,3),表明目标节点运行正常。
本实施例中,作为一可选实施例,获取故障检测心跳的节点与目标节点在共享文件系统中为相邻节点。
本实施例中,作为一可选实施例,查询所述共享存储空间上所述故障节点对应的资源区是否设置有同步标识包括:
查询共享存储空间上所述故障节点对应的日志区是否设置有同步标识;和/或,
查询共享存储空间上所述故障节点对应的空间分配器区是否设置有同步标识。
本实施例中,作为一可选实施例,可以在日志区设置同步标识,也可以在空间分配器区设置同步标识,还可以是在日志区和空间分配器区均设置同步标识。只要在日志区或空间分配器区上检测到同步标识,即表明故障节点对应的资源区设置有同步标识。
本实施例中,作为一可选实施例,同步标识可以为令牌,在日志区以及空间分配器区的预定位置写入令牌。作为另一可选实施例,同步标识也可以为其他能够表征已对故障节点进行同步处理的标识,例如,预先设置的字符或字符串等。
本实施例中,作为一可选实施例,为所述故障节点对应的资源区设置所述同步标识包括:设置同步标识的节点利用共享磁盘支持的小型计算机系统接口比较写(SCSI CAW,Small Computer System InterfaceCompare And Write)指令,将令牌写入到日志区、和/或,空间分配器区中的预定位置。这样,可以直接从预定位置查询是否有令牌,从而提升查询效率。
本实施例中,在查询到共享存储空间上故障节点对应的资源区设置有同步标识,表明有节点对故障节点进行资源回收,但由于回收故障节点的节点在回收资源的过程中,也可能发生故障,因而,作为一可选实施例,该方法还包括:
若所述共享存储空间上所述故障节点对应的资源区设置有同步标识,获取所述同步标识映射的节点写入的回放心跳;
若前后获取的所述同步标识映射的节点的回放心跳相同,更新所述同步标识的映射关系,执行所述回放所述日志区中的日志,回收所述空间分配器区中的空间的步骤。
本实施例中,为故障节点设置同步标识的节点为同步标识映射的节点。作为一可选实施例,更新所述同步标识的映射关系,是更新同步标识与节点的映射关系,例如,将当前同步标识映射的节点更新为获取该同步标识映射的节点回放心跳的节点,以表明当前对故障节点进行同步处理的节点。
本实施例中,作为另一可选实施例,获取所述同步标识映射的节点的回放心跳包括:
从所述资源区中预定心跳区域读取所述同步标识映射的节点写入的回放心跳。
本实施例中,同步标识映射的节点在对故障节点进行同步处理时,在资源区中预定心跳区域写入递增回放心跳序列,从而,可以使得获取该同步标识映射的节点回放心跳的节点更方便和快速获取回放心跳。
本实施例中,作为一可选实施例,可以在日志区以及空间分配器区预先设置的心跳区域分别写入回放心跳,该回放心跳以5秒为周期将递增回放心跳序列覆盖地写入到日志区和空间分配器区的心跳区域。
本实施例中,作为另一可选实施例,回放心跳和故障检测心跳可以是同一心跳,只是应用在不同的时机,例如,节点之间维持相互通信的心跳为故障检测心跳,用于检测节点之间是否发生故障;而在检测到故障节点对应的资源区设置有同步标识后,同步标识映射的节点维持的心跳成为回放心跳,用以表征该同步标识映射的节点是否正常执行回放日志以及回收空间的操作。
本实施例中,作为另一可选实施例,该方法还包括:
若前后获取的所述同步标识映射的节点的回放心跳不相同,放弃对所述日志的回放,以及,所述空间的回收。
本实施例中,若前后获取的所述同步标识映射的节点的回放心跳不相同,表明当前对故障节点执行同步处理的节点运行正常。
本实施例中,作为再一可选实施例,该方法还包括:
在完成回放日志,以及,回收空间后,清除设置的所述令牌。
本实施例中,在日志回放和空间回收操作完成后,清除写入到日志区和空间分配器区预定位置的令牌。
图3为本申请实施例提供的共享文件系统节点故障后的资源区同步方法另一流程示意图。如图3所示,该流程包括:
步骤301,所述共享文件系统中的非故障节点检测到故障节点,查询述共享存储空间上故障节点对应的资源区;
步骤302,判断是否设置有同步标识,若否,执行步骤303,若是,执行步骤306;
步骤303,为故障节点对应的资源区设置同步标识;
步骤304,回放资源区中日志区的日志以及回收空间分配器区中的空间;
步骤305,检测到完成回放日志,以及,回收空间,清除设置的同步标识;
步骤306,读取同步标识映射的节点的回放心跳;
步骤307,比对前后获取的该同步标识映射的节点的回放心跳,若相同,执行步骤308,若不相同,执行步骤309;
步骤308,更新同步标识的映射关系,执行步骤304;
步骤309,放弃对故障节点的同步。
图4为本申请实施例提供的共享文件系统节点故障后的资源区同步装置的结构示意图。应用于共享文件系统中的节点,各节点共享访问所述共享文件系统中用于存储元数据的共享存储空间,每一节点在所述共享存储空间上具有独占的日志区和空间分配器区,如图4所示,该装置包括:
同步标识查询模块41,用于检测到故障节点,查询所述共享存储空间上所述故障节点对应的资源区是否设置有同步标识,所述资源区包括日志区和空间分配器区,所述同步标识表征对所述故障节点进行同步;
同步标识设置模块42,若确认没有设置同步标识,为所述故障节点对应的资源区设置所述同步标识;
同步模块43,用于回放所述日志区中的日志,以及,回收所述空间分配器区中的空间。
本实施例中,作为一可选实施例,该装置还包括:心跳检测模块以及同步标识更新模块(图中未示出),其中,
同步标识设置模块,还用于若所述共享存储空间上所述故障节点对应的资源区设置有同步标识,通知心跳检测模块;
心跳检测模块,用于获取所述同步标识映射的节点的回放心跳;
同步标识更新模块,若前后获取的所述同步标识映射的节点的回放心跳相同,更新所述同步标识的映射关系,通知同步模块。
本实施例中,作为一可选实施例,所述心跳检测模块具体用于从所述资源区中预定心跳区域读取所述同步标识映射的节点的回放心跳。
本实施例中,作为另一可选实施例,同步标识更新模块还用于:
若前后获取的所述同步标识映射的节点的回放心跳不相同,放弃对所述日志的回放,以及,所述空间的回收。
本实施例中,作为一可选实施例,同步标识查询模块41包括:故障检测单元以及同步标识查询单元(图中未示出),其中,
故障检测单元,用于周期性从共享文件系统中的目标节点获取所述目标节点的故障检测心跳;比对获取的所述目标节点的故障检测心跳与上一周期该目标节点的故障检测心跳;若比对结果为相同,确定所述目标节点为故障节点;
同步标识查询单元,用于查询所述共享存储空间上所述故障节点对应的资源区是否设置有同步标识。
本实施例中,作为一可选实施例,所述同步标识包括令牌,同步标识设置模42具体用于:
利用小型计算机系统接口比较写指令,将令牌写入到在日志区、和/或,空间分配器区中的预定位置;
所述同步标识查询单元具体用于:
查询共享存储空间上所述故障节点对应的日志区是否设置有令牌;和/或,
查询共享存储空间上所述故障节点对应的空间分配器区是否设置有令牌;
所述装置还包括:
标识清除模块(图中未示出),用于在监测到完成回放日志,以及,回收空间后,清除设置的所述令牌。
图5为本申请实施例提供的计算机设备的结构示意图。如图5所示,本申请一实施例提供的一种计算机设备,用于执行图1至图3中的共享文件系统节点故障后的资源区同步方法,该设备包括存储器1000、处理器2000及存储在该存储器1000上并可在该处理器2000上运行的计算机程序,其中,上述处理器2000执行上述计算机程序时实现上述共享文件系统节点故障后的资源区同步方法的步骤。
具体地,上述存储器1000和处理器2000能够为通用的存储器和处理器,这里不做具体限定,当处理器2000运行存储器2000存储的计算机程序时,能够执行上述共享文件系统节点故障后的资源区同步方法,从而解决现有技术共享文件系统可靠性较低的问题,本申请通过在确认节点发生故障后,查询故障节点在共享存储空间上的资源区是否设置有同步标识,若未设置有同步标识,表示还未有其它节点对该故障节点执行同步,因而,为该故障节点对应的资源区设置同步标识后,回放该故障节点对应的日志区中的日志,以及,回收空间分配器区中的空间,从而通过设置同步标识的方式实现不同节点间分布式锁互斥域的一致,避免了多个节点同时对故障节点进行同步从而导致共享文件系统元数据不一致或遭到破坏的技术问题,提升了共享文件系统的可靠性。
对应于图1至图3中的共享文件系统节点故障后的资源区同步方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述共享文件系统节点故障后的资源区同步方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述共享文件系统节点故障后的资源区同步方法,从而解决现有技术共享文件系统可靠性较低的问题,本申请通过在确认节点发生故障后,查询故障节点在共享存储空间上的资源区是否设置有同步标识,若未设置有同步标识,表示还未有其它节点对该故障节点执行同步,因而,为该故障节点对应的资源区设置同步标识后,回放该故障节点对应的日志区中的日志,以及,回收空间分配器区中的空间,从而通过设置同步标识的方式实现不同节点间分布式锁互斥域的一致,避免了多个节点同时对故障节点进行同步从而导致共享文件系统元数据不一致或遭到破坏的技术问题,提升了共享文件系统的可靠性。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种共享文件系统节点故障后的资源区同步方法,其特征在于,应用于共享文件系统中的节点,各节点共享访问所述共享文件系统中用于存储元数据的共享存储空间,每一节点在所述共享存储空间上具有独占的日志区和空间分配器区,所述方法包括:
所述共享文件系统中的非故障节点检测到故障节点,查询所述共享存储空间上所述故障节点对应的资源区是否设置有同步标识,所述资源区包括日志区和空间分配器区,所述同步标识表征对所述故障节点进行同步;
若没有设置同步标识,为所述故障节点对应的资源区设置所述同步标识;
回放所述日志区中的日志,以及,回收所述空间分配器区中的空间。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述共享存储空间上所述故障节点对应的资源区设置有同步标识,获取所述同步标识映射的节点写入的回放心跳;
若前后获取的所述同步标识映射的节点的回放心跳相同,更新所述同步标识的映射关系,执行所述回放所述日志区中的日志,回收所述空间分配器区中的空间的步骤;
若前后获取的所述同步标识映射的节点的回放心跳不相同,放弃对所述日志的回放,以及,所述空间的回收。
3.根据权利要求2所述的方法,其特征在于,所述获取所述同步标识映射的节点写入的回放心跳包括:
从所述资源区中预定心跳区域读取所述同步标识映射的节点写入的回放心跳。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述检测到故障节点包括:
周期性从共享文件系统中的目标节点获取所述目标节点的故障检测心跳;
比对获取的所述目标节点的故障检测心跳与上一周期该目标节点的故障检测心跳;
若比对结果为相同,确定所述目标节点为故障节点。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述同步标识包括令牌,所述为所述故障节点对应的资源区设置所述同步标识包括:
利用小型计算机系统接口比较写指令,将令牌写入到在日志区、和/或,空间分配器区中的预定位置;
所述查询所述共享存储空间上所述故障节点对应的资源区是否设置有同步标识包括:
查询共享存储空间上所述故障节点对应的日志区的预定位置是否设置有令牌;和/或,
查询共享存储空间上所述故障节点对应的空间分配器区的预定位置是否设置有令牌;
所述方法还包括:
在完成回放日志,以及,回收空间后,清除设置的所述令牌。
6.一种共享文件系统节点故障后的资源区同步装置,其特征在于,应用于共享文件系统中的节点,各节点共享访问所述共享文件系统中用于存储元数据的共享存储空间,每一节点在所述共享存储空间上具有独占的日志区和空间分配器区,所述装置包括:
同步标识查询模块,用于检测到故障节点,查询所述共享存储空间上所述故障节点对应的资源区是否设置有同步标识,所述资源区包括日志区和空间分配器区,所述同步标识表征对所述故障节点进行同步;
同步标识设置模块,若确认没有设置同步标识,为所述故障节点对应的资源区设置所述同步标识;
同步模块,用于回放所述日志区中的日志,以及,回收所述空间分配器区中的空间。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:心跳检测模块以及同步标识更新模块,其中,
同步标识设置模块,还用于若所述共享存储空间上所述故障节点对应的资源区设置有同步标识,通知心跳检测模块;
心跳检测模块,用于获取所述同步标识映射的节点的回放心跳;
同步标识更新模块,若前后获取的所述同步标识映射的节点的回放心跳相同,更新所述同步标识的映射关系,通知同步模块;
若前后获取的所述同步标识映射的节点的回放心跳不相同,放弃对所述日志的回放,以及,所述空间的回收。
8.根据权利要求7所述的装置,其特征在于,所述心跳检测模块具体用于从所述资源区中预定心跳区域读取所述同步标识映射的节点的回放心跳。
9.根据权利要求6至8任一项所述的装置,其特征在于,所述同步标识查询模块41包括:故障检测单元以及同步标识查询单元,其中,
故障检测单元,用于周期性从共享文件系统中的目标节点获取所述目标节点的故障检测心跳;比对获取的所述目标节点的故障检测心跳与上一周期该目标节点的故障检测心跳;若比对结果为相同,确定所述目标节点为故障节点;
同步标识查询单元,用于查询所述共享存储空间上所述故障节点对应的资源区是否设置有同步标识。
10.根据权利要求9所述的装置,其特征在于,所述同步标识包括令牌,所述同步标识设置模具体用于:
利用小型计算机系统接口比较写指令,将令牌写入到在日志区、和/或,空间分配器区中的预定位置;
所述同步标识查询单元具体用于:
查询共享存储空间上所述故障节点对应的日志区的预定位置是否设置有令牌;和/或,
查询共享存储空间上所述故障节点对应的空间分配器区的预定位置是否设置有令牌;
所述装置还包括:
标识清除模块,用于在完成回放日志,以及,回收空间后,清除设置的所述令牌。
CN201810555356.XA 2018-06-01 2018-06-01 共享文件系统节点故障后的资源区同步方法及装置 Active CN108959390B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810555356.XA CN108959390B (zh) 2018-06-01 2018-06-01 共享文件系统节点故障后的资源区同步方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810555356.XA CN108959390B (zh) 2018-06-01 2018-06-01 共享文件系统节点故障后的资源区同步方法及装置

Publications (2)

Publication Number Publication Date
CN108959390A true CN108959390A (zh) 2018-12-07
CN108959390B CN108959390B (zh) 2019-10-18

Family

ID=64493339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810555356.XA Active CN108959390B (zh) 2018-06-01 2018-06-01 共享文件系统节点故障后的资源区同步方法及装置

Country Status (1)

Country Link
CN (1) CN108959390B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992220A (zh) * 2019-04-12 2019-07-09 苏州浪潮智能科技有限公司 一种锁释放方法、装置、设备及介质
CN112506710A (zh) * 2020-12-16 2021-03-16 深信服科技股份有限公司 分布式文件系统数据修复方法、装置、设备及存储介质
CN113760926A (zh) * 2020-12-02 2021-12-07 北京沃东天骏信息技术有限公司 一种数据读写系统及数据写入方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050022047A1 (en) * 2003-07-21 2005-01-27 Oracle International Corporation Conditional data access after database system failure
US20050132249A1 (en) * 2003-12-16 2005-06-16 Burton David A. Apparatus method and system for fault tolerant virtual memory management
US20050283658A1 (en) * 2004-05-21 2005-12-22 Clark Thomas K Method, apparatus and program storage device for providing failover for high availability in an N-way shared-nothing cluster system
CN101183982A (zh) * 2007-11-21 2008-05-21 烽火通信科技股份有限公司 一种基于多业务传输环网拓扑结构自动发现的方法
US20090063486A1 (en) * 2007-08-29 2009-03-05 Dhairesh Oza Data replication using a shared resource
CN103117901A (zh) * 2013-02-01 2013-05-22 华为技术有限公司 一种分布式心跳检测方法、装置及系统
CN103678337A (zh) * 2012-09-06 2014-03-26 华为技术有限公司 数据清除方法、装置及系统
US20140317438A1 (en) * 2013-04-23 2014-10-23 Neftali Ripoll System, software, and method for storing and processing information
CN106776130A (zh) * 2016-11-30 2017-05-31 华为技术有限公司 一种日志恢复方法、存储装置和存储节点

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050022047A1 (en) * 2003-07-21 2005-01-27 Oracle International Corporation Conditional data access after database system failure
US20050132249A1 (en) * 2003-12-16 2005-06-16 Burton David A. Apparatus method and system for fault tolerant virtual memory management
US20050283658A1 (en) * 2004-05-21 2005-12-22 Clark Thomas K Method, apparatus and program storage device for providing failover for high availability in an N-way shared-nothing cluster system
US20090063486A1 (en) * 2007-08-29 2009-03-05 Dhairesh Oza Data replication using a shared resource
CN101183982A (zh) * 2007-11-21 2008-05-21 烽火通信科技股份有限公司 一种基于多业务传输环网拓扑结构自动发现的方法
CN103678337A (zh) * 2012-09-06 2014-03-26 华为技术有限公司 数据清除方法、装置及系统
CN103117901A (zh) * 2013-02-01 2013-05-22 华为技术有限公司 一种分布式心跳检测方法、装置及系统
US20140317438A1 (en) * 2013-04-23 2014-10-23 Neftali Ripoll System, software, and method for storing and processing information
CN106776130A (zh) * 2016-11-30 2017-05-31 华为技术有限公司 一种日志恢复方法、存储装置和存储节点

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992220A (zh) * 2019-04-12 2019-07-09 苏州浪潮智能科技有限公司 一种锁释放方法、装置、设备及介质
CN109992220B (zh) * 2019-04-12 2022-07-08 苏州浪潮智能科技有限公司 一种锁释放方法、装置、设备及介质
CN113760926A (zh) * 2020-12-02 2021-12-07 北京沃东天骏信息技术有限公司 一种数据读写系统及数据写入方法
CN112506710A (zh) * 2020-12-16 2021-03-16 深信服科技股份有限公司 分布式文件系统数据修复方法、装置、设备及存储介质
CN112506710B (zh) * 2020-12-16 2024-02-23 深信服科技股份有限公司 分布式文件系统数据修复方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN108959390B (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
CN108959390B (zh) 共享文件系统节点故障后的资源区同步方法及装置
US9367598B2 (en) Merging an out of synchronization indicator and a change recording indicator in response to a failure in consistency group formation
US7698545B1 (en) Computer configuration chronology generator
TWI509423B (zh) 在叢集檔案系統間之同步更新
CN109522290B (zh) 一种HBase数据块恢复及数据记录提取方法
CN103714097A (zh) 一种访问数据库的方法和装置
CN103744906A (zh) 一种数据同步系统、方法及装置
US10048978B2 (en) Apparatus and method for identifying a virtual machine having changeable settings
US20120117031A1 (en) Apparatus, system and method for recovering meta data using fragmentary information
US8554727B2 (en) Method and system of tiered quiescing
CN103259688A (zh) 一种分布式存储系统的故障诊断方法与装置
CN104765661A (zh) 一种云存储服务中元数据服务节点的多节点热备方法
CN109145060A (zh) 数据处理方法及装置
CN109271376A (zh) 数据库升级方法、装置、设备及存储介质
CN103198122A (zh) 重启内存数据库的方法和装置
CN113010608A (zh) 数据实时同步方法、装置及计算机可读存储介质
CN103605617A (zh) 一种记录存储数据发生变化的方法及装置
CN105740049B (zh) 一种控制方法及装置
CN110354491B (zh) 全球同服游戏系统、数据同步方法、电子设备及介质
CN105975527A (zh) 道路上下行关系识别方法和装置
CN102412985A (zh) 一种基于操作分离的网管系统对象管理方法
CN103927327B (zh) 一种信息系统协同作业的数据库数据捕捉策略配置方法
CN102779134B (zh) 基于Lucene的分布式搜索方法
CN106685713A (zh) 一种处理配置参数的方法和装置
US10102263B2 (en) Database management method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant