CN110990190A - 一种分布式文件锁故障处理方法、系统、终端及存储介质 - Google Patents
一种分布式文件锁故障处理方法、系统、终端及存储介质 Download PDFInfo
- Publication number
- CN110990190A CN110990190A CN201911048525.1A CN201911048525A CN110990190A CN 110990190 A CN110990190 A CN 110990190A CN 201911048525 A CN201911048525 A CN 201911048525A CN 110990190 A CN110990190 A CN 110990190A
- Authority
- CN
- China
- Prior art keywords
- terminal
- client
- server
- file lock
- restart
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 8
- 238000012544 monitoring process Methods 0.000 claims abstract description 42
- 230000003993 interaction Effects 0.000 claims abstract description 29
- 238000000034 method Methods 0.000 claims description 31
- 238000013507 mapping Methods 0.000 claims description 30
- 238000004891 communication Methods 0.000 claims description 17
- 238000011084 recovery Methods 0.000 claims description 7
- 230000000903 blocking effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1438—Restarting or rejuvenating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/176—Support for shared access to files; File sharing support
- G06F16/1767—Concurrency control, e.g. optimistic or pessimistic approaches
- G06F16/1774—Locking methods, e.g. locking methods for file systems allowing shared and concurrent access to files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/604—Tools and structures for managing or administering access control systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Automation & Control Theory (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种分布式文件锁故障处理方法、系统、终端及存储介质,包括:建立本地与对端之间的网络状态监控交互链;在对端故障重启后本地通过所述监控交互链接收对端发送的故障重启信息;所述故障重启信息触发本地的文件锁管理协议,利用所述文件锁管理协议重启本地与对端的文件锁。本发明保证数据一致性、支持多客户端并发访问和系统的稳定性,在一方故障重启后,立即恢复之前已授权的文件锁,避免文件由于操作被打断而缺失。
Description
技术领域
本发明涉及分布式文件系统技术领域,具体涉及一种分布式文件锁故障处理方法、系统、终端及存储介质。
背景技术
目前,随着企业数据越来越庞大,用户对数据的传输性能和稳定性要求越来越高,存储服务端将拥有数目庞大的客户端,多个客户端同时对服务端文件进行访问操作,势必会造成文件冲突,各个客户端相互协同、保证文件数据一致性已经成为软件使用者和开发者关注的重点。因此,如何提供一个高效、可靠、易于实施和维护、具有高度一致性的网络文件系统文件锁显得尤为重要。
文件锁是一种机制,在多任务操作系统环境中,如果一个进程尝试对正在被其他进程读取的文件进行写操作,可能会导致正在进行读操作的进程读取到一些被破坏或者不完整的数据;如果两个进程并发对同一个文件进行写操作,可能会导致该文件遭到破坏。因此,为了避免发生这种问题,必须要采用某种机制来解决多个进程并发访问同一个文件时所面临的同步问题,由此而产生了文件加锁方面的技术。
因此为了避免多个客户端同时访问服务端同一存储区域的,最先访问服务端某一存储区域的可向服务端申请该区域的文件锁,其他客户端便不可再访问该存储区域。但是一旦服务端故障重启或申请文件锁的客户端文件锁便失效,此时若不及时恢复之前的文件锁,故障时正在执行的文件操作便被打断,无法继续执行,可能造成文件的缺失。
发明内容
针对现有技术的上述不足,本发明提供一种分布式文件锁故障处理方法、系统、终端及存储介质,以解决上述技术问题。
第一方面,本发明提供一种分布式文件锁故障处理方法,包括:
建立本地与对端之间的网络状态监控交互链;
在对端故障重启后本地通过所述监控交互链接收对端发送的故障重启信息;
所述故障重启信息触发本地的文件锁管理协议,利用所述文件锁管理协议重启本地与对端的文件锁。
进一步的,所述建立本地与对端之间的网络状态监控交互链,包括:
生成本地ID与对端ID的映射关系;
将所述映射关系分别保存在本地的通信映射表和对端的通信映射表中。
进一步的,所述在对端故障重启后本地通过所述监控交互链接收对端发送的故障重启信息,包括:
若对端为客户端,则根据客户端发送的标志位判定客户端故障重启;
若对端为服务端,则根据服务端发送的重启通知信息判定服务端故障重启。
进一步的,所述利用文件锁管理协议重启本地与对端的文件锁,包括:
若对端为客户端,则在接收到客户端发送的重启通知信息后向所述客户端释放已持有文件锁;
若对端为服务端,则在接收到服务端发送的重启通知信息后向服务端重新申请已授权的文件锁,通过发送所述文件锁申请请求令服务端在宽限期内为客户端恢复已授权的文件锁;在所述宽限期内阻塞所有读、写、lock请求。
第二方面,本发明提供一种分布式文件锁故障处理系统,包括:
监控交互单元,配置用于建立本地与对端之间的网络状态监控交互链;
重启监控单元,配置用于在对端故障重启后本地通过所述监控交互链接收对端发送的故障重启信息;
管理执行单元,配置用于所述故障重启信息触发本地的文件锁管理协议,利用所述文件锁管理协议重启本地与对端的文件锁。
进一步的,所述监控交互单元包括:
映射生成模块,配置用于生成本地ID与对端ID的映射关系;
映射保存模块,配置用于将所述映射关系分别保存在本地的通信映射表和对端的通信映射表中。
进一步的,所述重启监控单元包括:
客户端监控模块,配置用于根据客户端发送的标志位判定客户端故障重启。
服务端监控模块,配置用于若对端为服务端,则根据服务端发送的重启通知信息判定服务端故障重启。
进一步的,所述管理执行单元包括:
客户端故障恢复单元,配置用于若对端为客户端,则在接收到客户端发送的重启通知信息后向所述客户端释放已持有文件锁;
服务端故障恢复单元,配置用于若对端为服务端,则在接收到服务端发送的重启通知信息后向服务端重新申请已授权的文件锁,通过发送所述文件锁申请请求令服务端在宽限期内为客户端恢复已授权的文件锁;在所述宽限期内阻塞所有读、写、lock请求。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,
本发明提供的分布式文件锁故障处理方法、系统、终端及存储介质,通过设置一种文件锁管理协议(服务端故障重启,则服务端发起通知,在约定的宽限期内恢复客户端已申请的锁;客户端故障重启,则客户端发起通知服务端需要释放客户端所申请的锁。),在服务端与客户端建立网络状态监控交互链后,双方均可以获知对方故障重启的信息。在获知对方故障重启后,立即触发文件锁管理协议,双方恢复文件锁。本发明保证数据一致性、支持多客户端并发访问和系统的稳定性,在一方故障重启后,立即恢复之前已授权的文件锁,避免文件由于操作被打断而缺失。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的系统的示意性框图。
图3为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面对本发明中出现的关键术语进行解释。
NFS网络文件系统。
NFS-Ganesha用户态网络文件系统。
NSM网络状态监控器,在Linux上,NSM服务进程由两个独立的用户空间程序组成,rpc.statd该守护进程用于监听其他主机的重启消息,并管理本地主机重启时需要通知的主机列表。sm-notify是一个辅助程序,用于在本地系统重启时通知NFS对端。
NLM网络锁管理协议,文件锁管理器在接收到对端重启信息后将维护与重启端对应文件的锁。
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种分布式文件锁故障处理系统。
如图1所示,该方法100包括:
步骤110,建立本地与对端之间的网络状态监控交互链;
步骤120,在对端故障重启后本地通过所述监控交互链接收对端发送的故障重启信息;
步骤130,所述故障重启信息触发本地的文件锁管理协议,利用所述文件锁管理协议重启本地与对端的文件锁。
可选地,作为本发明一个实施例,所述建立本地与对端之间的网络状态监控交互链,包括:
生成本地ID与对端ID的映射关系;
将所述映射关系分别保存在本地的通信映射表和对端的通信映射表中。
可选地,作为本发明一个实施例,所述在对端故障重启后本地通过所述监控交互链接收对端发送的故障重启信息,包括:
若对端为客户端,则根据客户端发送的标志位判定客户端故障重启;
若对端为服务端,则根据服务端发送的重启通知信息判定服务端故障重启。
可选地,作为本发明一个实施例,所述利用文件锁管理协议重启本地与对端的文件锁,包括:
若对端为客户端,则在接收到客户端发送的重启通知信息后向所述客户端释放已持有文件锁;
若对端为服务端,则在接收到服务端发送的重启通知信息后向服务端重新申请已授权的文件锁,通过发送所述文件锁申请请求令服务端在宽限期内为客户端恢复已授权的文件锁;在所述宽限期内阻塞所有读、写、lock请求。
为了便于对本发明的理解,下面以本发明分布式文件锁故障处理方法的原理,结合实施例中对分布式文件锁故障进行处理的过程,对本发明提供的分布式文件锁故障处理方法做进一步的描述。
具体的,所述分布式文件锁故障处理方法包括:
S1、建立本地与对端之间的网络状态监控交互链。
本地与对端指具有文件锁的两个端(客户端和服务端),当本地为客户端时,对端为服务端;若本地为服务端则对端为客户端。NFS-Ganesha服务端与客户端部署网络状态监控器Network Status Monitor(NSM)服务,在Linux上,NSM服务进程由两个独立的用户空间程序组成,rpc.statd该守护进程用于监听其他主机的重启消息,并管理本地主机重启时需要通知的主机列表。sm-notify是一个辅助程序,用于在本地系统重启时通知NFS对端。
S2、在对端故障重启后本地通过所述监控交互链接收对端发送的故障重启信息。
NFS客户端和服务端之间的第一个文件锁交互行为,会使得两端的NLM管理本地的NSM服务以存储它们对端的信息。在Linux上,也就是让本地NLM锁管理器管理rpc.statd守护进程。rpc.statd会将NFS对端信息记录在/var/lib/nfs/statd目录下。每个客户端在每个文件锁请求中都会发送一个称为客户端caller_name的主机名。NFS服务端可以使用该主机名向客户端发送异步GRANT调用,或者通知客户端它已经重启完成。
若客户端异常故障重启,服务端根据客户端发过来的标志位可知客户端重启。所述标志位是指NFS客户端请求标志位reclaim,若为true则表示客户端重启过;反之,则未重启。
若服务端异常故障场景,服务器重启将导致所有的客户端锁状态失效,客户端进行文件操作时将知道lock状态丢失。当lock状态丢失,client重建锁状态。服务端重启后,服务端会主动通知客户端告知服务已重启。
S3、所述故障重启信息触发本地的文件锁管理协议,利用所述文件锁管理协议重启本地与对端的文件锁。
若客户端发生故障重启,服务端根据客户端sm-notify(重启通知)通知服务端释放客户端已经持有的文件锁。
若服务端发生故障重启,服务端重启后,服务端会主动通知客户端告知服务已重启,同时服务端进入宽限期,在宽限期lease period期间内NFS-Ganesha服务阻塞所有的读、写、lock等请求,目的是防止服务确保不发生锁冲突。本实施例将宽限期设置为90s。客户端在接收到服务端故障重启通知后向服务端重新申请已授权的文件锁,服务端接收到申请请求后恢复已授权的文件锁,恢复文件锁操作在宽限期内完成。
如图2示,该系统200包括:
监控交互单元210,配置用于建立本地与对端之间的网络状态监控交互链;
重启监控单元220,配置用于在对端故障重启后本地通过所述监控交互链接收对端发送的故障重启信息;
管理执行单元230,配置用于所述故障重启信息触发本地的文件锁管理协议,利用所述文件锁管理协议重启本地与对端的文件锁。
可选地,作为本发明一个实施例,所述监控交互单元包括:
映射生成模块,配置用于生成本地ID与对端ID的映射关系;
映射保存模块,配置用于将所述映射关系分别保存在本地的通信映射表和对端的通信映射表中。
可选地,作为本发明一个实施例,所述重启监控单元包括:
客户端监控模块,配置用于根据客户端发送的标志位判定客户端故障重启。
服务端监控模块,配置用于若对端为服务端,则根据服务端发送的重启通知信息判定服务端故障重启。
可选地,作为本发明一个实施例,所述管理执行单元包括:
客户端故障恢复单元,配置用于若对端为客户端,则在接收到客户端发送的重启通知信息后向所述客户端释放已持有文件锁;
服务端故障恢复单元,配置用于若对端为服务端,则在接收到服务端发送的重启通知信息后向服务端重新申请已授权的文件锁,通过发送所述文件锁申请请求令服务端在宽限期内为客户端恢复已授权的文件锁;在所述宽限期内阻塞所有读、写、lock请求。
图3为本发明实施例提供的一种终端系统300的结构示意图,该终端系统300可以用于执行本发明实施例提供的分布式文件锁故障处理方法。
其中,该终端系统300可以包括:处理器310、存储器320及通信单元330。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务端的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器320可以用于存储处理器310的执行指令,存储器320可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器320中的执行指令由处理器310执行时,使得终端300能够执行以下上述方法实施例中的部分或全部步骤。
处理器310为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器320内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器310可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元330,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
因此,本发明通过设置一种文件锁管理协议(服务端故障重启,则服务端发起通知,在约定的宽限期内恢复客户端已申请的锁;客户端故障重启,则客户端发起通知服务端需要释放客户端所申请的锁。),在服务端与客户端建立网络状态监控交互链后,双方均可以获知对方故障重启的信息。在获知对方故障重启后,立即触发文件锁管理协议,双方恢复文件锁。本发明保证数据一致性、支持多客户端并发访问和系统的稳定性,在一方故障重启后,立即恢复之前已授权的文件锁,避免文件由于操作被打断而缺失,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务端,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种分布式文件锁故障处理方法,其特征在于,包括:
建立本地与对端之间的网络状态监控交互链;
在对端故障重启后本地通过所述监控交互链接收对端发送的故障重启信息;
所述故障重启信息触发本地的文件锁管理协议,利用所述文件锁管理协议重启本地与对端的文件锁。
2.根据权利要求1所述的方法,其特征在于,所述建立本地与对端之间的网络状态监控交互链,包括:
生成本地ID与对端ID的映射关系;
将所述映射关系分别保存在本地的通信映射表和对端的通信映射表中。
3.根据权利要求1所述的方法,其特征在于,所述在对端故障重启后本地通过所述监控交互链接收对端发送的故障重启信息,包括:
若对端为客户端,则根据客户端发送的标志位判定客户端故障重启;
若对端为服务端,则根据服务端发送的重启通知信息判定服务端故障重启。
4.根据权利要求1所述的方法,其特征在于,所述利用文件锁管理协议重启本地与对端的文件锁,包括:
若对端为客户端,则在接收到客户端发送的重启通知信息后向所述客户端释放已持有文件锁;
若对端为服务端,则在接收到服务端发送的重启通知信息后向服务端重新申请已授权的文件锁,通过发送所述文件锁申请请求令服务端在宽限期内为客户端恢复已授权的文件锁;在所述宽限期内阻塞所有读、写、lock请求。
5.一种分布式文件锁故障处理处理系统,其特征在于,包括:
监控交互单元,配置用于建立本地与对端之间的网络状态监控交互链;
重启监控单元,配置用于在对端故障重启后本地通过所述监控交互链接收对端发送的故障重启信息;
管理执行单元,配置用于所述故障重启信息触发本地的文件锁管理协议,利用所述文件锁管理协议重启本地与对端的文件锁。
6.根据权利要求5所述的系统,其特征在于,所述监控交互单元包括:
映射生成模块,配置用于生成本地ID与对端ID的映射关系;
映射保存模块,配置用于将所述映射关系分别保存在本地的通信映射表和对端的通信映射表中。
7.根据权利要求5所述的系统,其特征在于,所述重启监控单元包括:
客户端监控模块,配置用于根据客户端发送的标志位判定客户端故障重启;
服务端监控模块,配置用于若对端为服务端,则根据服务端发送的重启通知信息判定服务端故障重启。
8.根据权利要求5所述的系统,其特征在于,所述管理执行单元包括:
客户端故障恢复单元,配置用于若对端为客户端,则在接收到客户端发送的重启通知信息后向所述客户端释放已持有文件锁;
服务端故障恢复单元,配置用于若对端为服务端,则在接收到服务端发送的重启通知信息后向服务端重新申请已授权的文件锁,通过发送所述文件锁申请请求令服务端在宽限期内为客户端恢复已授权的文件锁;在所述宽限期内阻塞所有读、写、lock请求。
9.一种终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-4任一项所述的方法。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911048525.1A CN110990190A (zh) | 2019-10-31 | 2019-10-31 | 一种分布式文件锁故障处理方法、系统、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911048525.1A CN110990190A (zh) | 2019-10-31 | 2019-10-31 | 一种分布式文件锁故障处理方法、系统、终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110990190A true CN110990190A (zh) | 2020-04-10 |
Family
ID=70082764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911048525.1A Pending CN110990190A (zh) | 2019-10-31 | 2019-10-31 | 一种分布式文件锁故障处理方法、系统、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110990190A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111680015A (zh) * | 2020-05-29 | 2020-09-18 | 北京百度网讯科技有限公司 | 文件资源处理方法、装置、设备和介质 |
CN111737201A (zh) * | 2020-06-05 | 2020-10-02 | 苏州浪潮智能科技有限公司 | 一种已打开文件的关闭方法、计算机设备和存储介质 |
CN114448778A (zh) * | 2021-12-29 | 2022-05-06 | 中国航空工业集团公司西安航空计算技术研究所 | 一种标准网络文件系统的网络锁及其故障恢复方法 |
CN114710976A (zh) * | 2020-10-16 | 2022-07-05 | 华为技术有限公司 | 一种锁重申方法、锁管理方法以及服务器 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101567805A (zh) * | 2009-05-22 | 2009-10-28 | 清华大学 | 并行文件系统发生故障后的恢复方法 |
US20120259820A1 (en) * | 2011-04-08 | 2012-10-11 | Symantec Corporation | Method and system for restarting file lock services at an adoptive node during a network filesystem server migration or failover |
CN107515935A (zh) * | 2017-08-29 | 2017-12-26 | 郑州云海信息技术有限公司 | 一种解除文件锁故障的方法及系统 |
CN109684285A (zh) * | 2018-12-13 | 2019-04-26 | 郑州云海信息技术有限公司 | 一种用户态网络文件系统文件锁方法、装置及设备 |
-
2019
- 2019-10-31 CN CN201911048525.1A patent/CN110990190A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101567805A (zh) * | 2009-05-22 | 2009-10-28 | 清华大学 | 并行文件系统发生故障后的恢复方法 |
US20120259820A1 (en) * | 2011-04-08 | 2012-10-11 | Symantec Corporation | Method and system for restarting file lock services at an adoptive node during a network filesystem server migration or failover |
CN107515935A (zh) * | 2017-08-29 | 2017-12-26 | 郑州云海信息技术有限公司 | 一种解除文件锁故障的方法及系统 |
CN109684285A (zh) * | 2018-12-13 | 2019-04-26 | 郑州云海信息技术有限公司 | 一种用户态网络文件系统文件锁方法、装置及设备 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111680015A (zh) * | 2020-05-29 | 2020-09-18 | 北京百度网讯科技有限公司 | 文件资源处理方法、装置、设备和介质 |
US11451628B2 (en) | 2020-05-29 | 2022-09-20 | Beijing Baidu Netcom Science And Technology Co., Ltd. | File resource processing method and apparatus, device and medium |
CN111680015B (zh) * | 2020-05-29 | 2023-08-11 | 北京百度网讯科技有限公司 | 文件资源处理方法、装置、设备和介质 |
CN111737201A (zh) * | 2020-06-05 | 2020-10-02 | 苏州浪潮智能科技有限公司 | 一种已打开文件的关闭方法、计算机设备和存储介质 |
CN111737201B (zh) * | 2020-06-05 | 2022-11-22 | 苏州浪潮智能科技有限公司 | 一种已打开文件的关闭方法、计算机设备和存储介质 |
CN114710976A (zh) * | 2020-10-16 | 2022-07-05 | 华为技术有限公司 | 一种锁重申方法、锁管理方法以及服务器 |
CN114448778A (zh) * | 2021-12-29 | 2022-05-06 | 中国航空工业集团公司西安航空计算技术研究所 | 一种标准网络文件系统的网络锁及其故障恢复方法 |
CN114448778B (zh) * | 2021-12-29 | 2024-01-23 | 中国航空工业集团公司西安航空计算技术研究所 | 一种标准网络文件系统的网络锁及其故障恢复方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110990190A (zh) | 一种分布式文件锁故障处理方法、系统、终端及存储介质 | |
US10387255B2 (en) | Data reconstruction method in distributed storage system, apparatus, and system | |
JP4570312B2 (ja) | コンピュータシステムにおいてボリュームスナップショット依存関係を提供する方法および装置 | |
CN109101341A (zh) | 分布式锁的分配方法及设备 | |
US8504873B1 (en) | Method and apparatus for providing in-memory checkpoint services within a distributed transaction | |
CN108616574B (zh) | 管理数据的存储方法、设备及存储介质 | |
CN112506702B (zh) | 数据中心容灾方法、装置、设备及存储介质 | |
CN112235136B (zh) | 一种网络文件系统备份方法、系统、终端及存储介质 | |
CN109144748B (zh) | 一种服务器、分布式服务器集群及其状态驱动方法 | |
CN111309524A (zh) | 分布式存储系统故障恢复方法、装置、终端及存储介质 | |
CN112395047A (zh) | 虚拟机故障疏散方法、系统及计算机可读介质 | |
CN113407383B (zh) | 主备系统切换方法、装置、服务器及主备系统 | |
CN111125048B (zh) | 一种故障通知方法、装置、设备及计算机可读存储介质 | |
CN109391691A (zh) | 一种单节点故障下nas服务的恢复方法及相关装置 | |
CN111026807A (zh) | 分布式锁的同步方法、装置、计算机设备及可读存储介质 | |
CN109257396B (zh) | 一种分布式锁调度方法及装置 | |
CN108512753B (zh) | 一种集群文件系统中消息传输的方法及装置 | |
US20230004465A1 (en) | Distributed database system and data disaster backup drilling method | |
CN111404737B (zh) | 一种容灾处理方法以及相关装置 | |
CN112492011A (zh) | 分布式存储系统故障切换方法、系统、终端及存储介质 | |
CN114301763A (zh) | 分布式集群故障的处理方法及系统、电子设备及存储介质 | |
JPH07114495A (ja) | 多重化ファイル管理方式 | |
CN111722946A (zh) | 分布式事务处理方法、装置、计算机设备及可读存储介质 | |
CN111752911A (zh) | 一种基于Flume的数据传输方法、系统、终端及存储介质 | |
CN111813501A (zh) | 一种数据删除方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200410 |
|
RJ01 | Rejection of invention patent application after publication |