WO2017113261A1

WO2017113261A1 - 加锁请求的处理方法及服务器

Info

Publication number: WO2017113261A1
Application number: PCT/CN2015/100006
Authority: WO
Inventors: 冯锐; 陈�光; 刘军
Original assignee: 华为技术有限公司
Priority date: 2015-12-30
Filing date: 2015-12-30
Publication date: 2017-07-06
Also published as: EP3232609B1; EP3232609A4; US10846185B2; EP3232609A1; JP2018503887A; AU2015408848A1; AU2015408848B2; JP6357587B2; BR112017011541A2; KR102016702B1; US20180300210A1; CN107466456A; KR20180090181A; CN107466456B; BR112017011541B1; CA2960982C; CA2960982A1; SG11201703260QA

Abstract

本发明提出一种锁请求的处理技术，第一锁服务器是第二锁服务器的接管锁服务器，所述第一锁服务器在获知所述第二锁服务器发生故障后进入静默状态，静默范围是第二锁服务器已经分配过权限的资源，第一锁服务器收到原本发送给第二锁服务器加锁请求，如果第二锁服务器未曾给这个资源分配资源，则所述第一锁服务器按照加锁请求给所述给相应的资源分配锁权限。应用该方案，可以把锁服务器发生故障所影响的范围减小，提高所管理系统系统的稳定性。

Description

加锁请求的处理方法及服务器

技术领域

本发明涉及计算机技术，尤其是涉及一种锁请求的处理方法及其系统。

背景技术

在由多个主机组成的分布式系统中，由锁服务器实现在同一时间、多个节点对同一资源的互斥访问。当主机需要对资源进行一些操作时，首先需要向锁服务器请求锁权限，当主机获取锁权限之后，才能对资源进行相应的操作，例如读操作或者写操作。所以，锁服务器的性能高低、可用性以及可靠性直接影响到整个分布式系统的性能、可用性和可靠性。

在分布式系统中，主机通过NAS(Network Attacked Storage，网络附属存储)网络与节点通信。每个节点中都设置有锁服务器，各个节点还和存储系统相连，存储系统中存储有文件等资源。

当主机需要对存储系统中的资源进行操作(例如读操作或者写操作)时，先通过主机上的应用程序向锁服务器申请锁权限，获得所服务器给资源分配的锁权限之后，再对文件进行操作。资源的已分配的锁权限与应用程序之间的对应关系，可以存储在各个节点中，也可以存储在各个节点都可以访问的共享存储中。例如，主机需要对存储系统中的文件进行读操作时，首先向某个节点中的锁服务器申请该文件的锁权限，主机在获得该文件的锁权限之后，才能对该文件进行读操作。文件的锁权限与拥有锁权限的应用的对应关系存储在节点中，拥有锁权限的是节点或者节点中的应用。即使拥有锁权限的是节点，这个节点也可以通过进一步的分析，获知是节点中的哪个应用需要使用存储系统中的资源。

当某个锁服务器发生故障时，故障锁服务器上的业务需要切换到未发生故障的锁服务器(后文称为非故障锁服务器)上。在使用NFS(Network File System，网络文件系统)或者Samba等协议时，为了加速主机的访问效率，在故障锁服务器上的业务切换到非故障锁服务器上，主机可以通过锁重申请求来重新申请各应用已经获取的文件的锁权限。这样，在分布式锁服务器集群中，需要安全的对锁重申请求和加锁请求进行控制，避免由于锁权限控制不当而导致多个应用看到的数据不一致，甚至多个应用同时读写数据时造成数据崩溃的问题。

而在现有技术中，当有锁服务器发生故障时，分布式系统中余下的全部锁服务器都进入静默状态。在静默期间，分布式系统中的锁服务器都只能处理重新申请锁权限的锁重申请求，不能处理申请新的锁权限的加锁请求。待故障锁服务器的已授权的锁权限的锁重申请求处理完成后，分布式系统中的锁服务器才退出静默状态，正常处理加锁请求。

在上述现有技术方案中，当分布式系统中有锁服务器发生故障时，分布式系统中的所有锁服务器需要进入静默状态，此时，对任意锁服务器发出的加锁请求，都会被拒绝处理，导致系统的性能和可靠性明显下降。

发明内容

本发明的第一方面，提供一种锁请求的处理方法，可以应用于第一锁服务器，其中，所述第一锁服务器是第二锁服务器的接管锁服务器，所述第一锁服务器存储有所述第二锁服务器的锁管理范围，该方法包括：所述第一锁服务器在获知所述第二锁服务器发生故障后进入静默状态，所述静默状态的静默范围是第二锁服务器已经分配过权限的资源；第一锁服务器接收第一加锁请求，所述第一加锁请求用于请求给第一资源加锁，所述第一加锁请求中携带有第一资源标识；所述第一锁服务器检测到所述第一资源属于所述第二锁服务器的管理范围；所述第一锁服务器查询第一资源信息记录表，所述第一资源信息记录表记录有已被所述第二锁服务器分配了锁权限的资源的ID，如果所述第一资源信息记录表中未记录所述第一资源标识，则所述第一锁服务器按照所述第一加锁请求给所述第一资源分配锁权限。

应用该方法，当第二锁服务器故障后，第一锁服务器仅部分进入静默，静默期间，可以对原本第二锁服务未曾分配锁权限的加锁请求进行处理。提高了系统效率。

此外，应用该方法，第一锁服务器静默期间，第一锁服务器原本的管理范围内的资源不纳入静默范围，因此可以正常处理。再者，由第一锁服务器、第二锁服务器以及其他锁服务器组成的分布式锁管理系统中，第一锁服务器静默期间，第一锁服务器、第二锁服务器之外的锁服务器可以不进入静默，继续正常工作。

第一方面的第一种可能实现方式中，进一步包括：所述第一锁服务器接收第二加锁请求，所述第二加锁请求用于请求给第二资源加锁，所述第二加锁请求中携带有第二资源的标识；所述第一锁服务器检测到所述第二资源属于所述第一锁服务器的管理范围；所述第一锁服务器按照所述第二加锁请求给所述第二资源分配锁权限。

应用该方法，第一锁服务器静默期间，第一锁服务器原本的管理范围内的资源不纳入静默范围，因此可以正常处理。

第一方面的第二种可能实现方式中，在前述任意方面或者任意实现方式的基础上，可以进一步包括：在所述第一锁服务器进入所述静默状态后，第一锁服务器接收第三加锁请求，所述第三加锁请求用于请求给第三资源加锁，所述第三加锁请求中携带有第三资源的标识；所述第一锁服务器检测到所述第三资源属于所述第二锁服务器的管理范围；所述第一锁服务器查询第一资源信息记录表，如果所述第一资源信息记录表中已经记录所述第三加锁请求所请求的资源的ID，则所述第一锁服务器拒绝按照第三加锁请求给第三资源分配锁权限。

应用该方法，对于已经由第二锁服务器分配过权限的资源加锁请求，拒绝处理，避免了加锁冲突。

第一方面的第三种可能实现方式中，在前述任意方面或者任意实现方式的基础上，可以进一步包括：所述第一锁服务器将所述第一资源标识记录到第二资源信息记录表中；其中，所述第二资源信息记录表用于记录所述第一锁服务器已分配了锁权限的资源的ID，所述第二资源信息记录表存储在第三锁服务器中。

应用该方法，可以对第一锁服务器加锁情况进行记录，当第一锁服务器未来故障后，可以由其对应的接管锁服务器进行接管。接管方法如述类似。

第一方面的第四种可能实现方式中，在前述任意方面或者任意实现方式的基础上，其中，所述第一锁服务器存储所述第二锁服务器的锁管理范围的步骤包括：所述第一锁服务器接收第一通知消息，所述第一通知消息中携带有所述第二锁服务器的标识信息；所述第一锁服务器根据所述第二锁服务器的标识和锁服务器接管关系，确定所述第一锁服务器为所述第二锁服务器的接管锁服务器；所述第一锁服务器接收所述第二锁服务器的锁管理范围并进行存储。

应用该方法，提供了一种第一锁服务器如何获得第二锁服务器的锁管理范围的方案。

第一方面的第五种可能实现方式中，在前述任意方面或者任意实现方式的基础上，可以进一步包括：协议服务器接收来自主机的报文，并从所述报文中解析出所述第一加锁请求；所述协议服务器把所述第一加锁请求转发给锁代理；所述锁代理根据第一加锁请求中携带的第一资源标识进行判断，当判断出管理所述第一资源的是所述第一锁服务器时，把所述第一加锁请求发送给所述第一锁服务器。

应用该方法，增加了协议服务器和锁代理，提供了一种由锁服务器、协议服务器和锁代理共同执行的锁管理技术。

第一方面的第六种可能实现方式中，在前述任意方面或者任意实现方式的基础上，可以进一步包括：所述第一锁服务器进入静默状态之后，接收锁重申请求，所述锁重申请求中携带第四资源的标识，以及所述第四资源由所述第二锁服务器分配的权限，所述第四资源是所述第二锁服务器已经分配过权限的资源；按照所述第二锁服务器已经分配的权限，给所述第四资源重新分配相同的权限。

应用该方法，在静默期间，通过对锁重申进行处理，恢复在第二锁服务器故障前已经分配的锁权限。

第一方面的第七种可能实现方式中，在前述任意方面或者任意实现方式的基础上，可以进一步包括：在给所述第二锁服务器已经分配过权限的资源全部重新分配权限后，所述第一锁服务器退出静默状态；或者，在达到预设时间后，所述第一锁服务器退出静默状态。

应用该方法，提供一种静默退出机制。避免锁服务器长时间处于静默状态。

可选的，第一方面的第八种可能实现方式：第一锁服务器退出静默后，所述第一锁服务器更新所述第一锁服务器的管理范围，更新后的所述第一锁服务器的管理范围，包括更新前的所述第一锁服务器的管理范围以及所述所述第二锁服务器的管理范围。

可选的，接管关系可以由管理节点计算后广播给各个锁服务器。也可以由各个锁服务器自行更新。

应用该方法，完成了第一锁服务器对第二锁服务器的整个接管流程。

第一方面的第九种可能实现方式：第一资源信息表可以存储在第一锁服务器中，也可以存储在其他锁服务器中，或者非锁服务器中，能够被第一锁服务器获取即可。

应用该方法，提高了第一只有信息表存储自由度，方便用户根据实际需要设计产品。

第一方面第十种可能的实现方式中，各方面以及各可能实现方式均可以运行在虚拟机环境中，也就是说锁服务器运行在虚拟机中。因此，锁服务器可以是硬件、执行硬件的软件、运行在虚拟机中的软件三种可能实现方式。

第一方面第十一种可能的实现方式中，在开始接管后，例如静默期间，第一锁服务器还向非故障节点的锁代理发送查询消息，非故障节点的锁代理收到查询消息后，向第一锁服务器发送反馈消息，反馈消息中携带本锁代理通过第二锁服务器申请到的锁权限，并由第一锁服务器记录到详细资源信息记录表中。

本发明还提供锁请求管理装置以及服务器的实现方式，具有以上第一方面以及各可能实现方式的功能。

相应地，本发明还提供了非易失性计算机可读存储介质和计算机程序产品，当本发明提供的存储设备的内存加载非易失性计算机可读存储介质和计算机程序产品中包含的计算机指令，存储设备的中央处理单元(Center Processing Unit，CPU)执行该计算机指令时，分别使存储设备执行本第一方面以及各可能实现方式的各种可能实现方案。可以运行在装置或者服务器中得以执行。

附图说明

图1是本发明实施例提供的一种锁管理系统使用环境拓扑图。

图2是本发明提供的锁服务器管理范围和锁服务器接管关系实施例示意图。

图3是本发明实施例锁请求处理方法流程图。

图4是本发明锁请求管理装置实施例结构图。

图5是本发明服务器实施例结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

本发明实施例中，本发明实施例提出建立各个锁服务器接管关系。这样，当其中一个锁服务器发生故障时，根据所述接管关系可以获得故障锁服务器的接管锁服务器。

锁服务器是能够处理锁请求的服务器。锁请求(lock request)可以是加锁请求(acquire lock request)或锁重申请求(reclaim lock request)。加锁请求可以是读锁请求或者写锁请求。加锁请求申请的是对某个资源进行加锁，加锁后权限拥有者获得锁权限，也就是说仅权限拥有者对这个资源拥有相应的操作权限。例如读锁请求是用于申请获得读取资源的权限；写锁请求是用于申请对某个资源写入数据的权限。锁重申请求,是权限拥有者重新申请已经获得的锁权限。例如主机原本通过节点1访问存储系统，后来节点1出现了故障，主机改为通过节点2访问存储系统，主机通过向节点2发出锁重申请求，以获得之前已经获得的锁权限。

锁请求还可以包括释放锁请求(release lock request)，用于释放对文件的锁权限，以便其他主机可以对文件申请锁权限。

当锁服务器发生故障时，称其为故障锁服务器。故障锁服务器的锁管理工作由其接管锁服务器接管。仅接管锁服务器进入静默状态，其余锁服务器不进入静默状态，可以正常处理锁请求。和现有技术相比，减小了锁服务器故障对整个系统造成的影响。

进一步的，即使已经进入静默状态的接管锁服务器，也仅针对部分资源进入静默状态，因此，仍然可以对一部分加锁请求(未进入静默状态的资源的加锁请求)进行正常的响应。进一步提高了锁服务器的利用率，并且降低了锁服务器进入静默后对系统造成的影响。对于静默状态所针对的资源，锁服务器对加锁请求不做处理。对于静默状态所针对的资源，可以对锁重申请求进行处理。对非静默状态所针对的资源的锁请求，锁服务器可以对加锁请求进行处理，例如对资源的读锁请求，给予锁权限；对资源的写锁请求，通过回收已分配写锁的方式，给予锁权限。针对部分资源进入静默状态，也可以看做对这部分资源的加锁请求进入静默状态，这部分资源是故障锁服务器分配过权限的资源，而进入静默状态的是故障锁服务器的接管锁服务器。

原本就由接管锁服务器管理的加锁请求，维持在正常态，不受静默状态影响。如果收到的加锁请求在故障锁服务管理范围内，并且在这之前，故障锁服务器不曾为这个锁请求锁请求的资源分配锁权限。那么接管锁服务器可以对这个锁请求进行正常响应，为其分配锁权限。如果收到的加锁请求在故障锁服务管理范围内，并且在这之前，故障锁服务器曾经为这个锁请求锁请求的资源分配过锁权限，那么就拒绝为其分配锁权限。

由于对于原本就由接管锁服务器管理的加锁请求，不受静默状态影响，不进入静默状态。和静默之前的处理方式相同，因此可以不用详细介绍。后文中，在没有特别说明的情况下，“加锁请求”是指：原本在故障锁服务管理范围内，在故障锁服务器发生故障后，被接管锁服务器接管的加锁请求。

本发明实施例可以应用在分布式系统中，分布系统由多个节点组成，每个节点管理一部分文件的锁权限。节点例如是锁服务器，可以包括处理器、对外接口和存储器。当分布式系统中有锁服务器发生故障时，分布式系统中的非故障锁服务器进入静默状态，提出一种锁权限的管理方法。节点还可以集成协议服务器和锁代理，成为锁服务器、协议服务器和锁代理三者的组合。

锁服务器在分配锁权限之后，将分配了锁权限的资源的标识备份到指定的锁服务器中这个指定的锁服务器可以是锁服务器的接管锁服务器，也可以是能够被锁服务器的备份服务器访问的其他锁服务器。故障锁服务器的接管锁服务器在接收到加锁请求之后，根据备份的资源的标识确定加锁请求所请求的锁权限是否已分配，如果已分配，则返回拒绝的响应消息；如果未分配，则为主机分配加锁请求所请求的锁权限。节点可以仅包括锁服务器，还可以集成其他功能模块，例如协议服务器、锁代理。

锁服务器分配权限后生成分配记录，分配记录信息例如：{节点1，文件A，写入权限}，这表示节点1分配了对文件A的写入权限；{节点2，文件B，读出权限}，这表示节点2对文件B拥有读出权限。按照发出加锁请求的主机，协议服务器可以把节点的分配记录转换成主机的分配记录。例如，如果发出加锁请求的是主机1，把节点1转换成主机1，成为{主机1，文件A，写入权限}，这表示主机1拥有对文件A的写入权限；节点可以把这个信息可以发送给对应的主机进行存储。

分配了锁权限的资源的标识备份到指定的服务器，例如分配权限的锁服务器的备份锁服务器，或者其他锁服务器。可以不用备份锁权限的具体内容。也就是说，指定的服务器知道哪些资源分配了锁权限，但是不知道锁权限是什么。由于可以只备份分配了锁权限的资源的标识，不备份锁权限的具体内容，因此对系统资源的占用也不多，不会对分布式系统的资源造成大的影响。

本发明实施例中，涉及的分布式系统由多个节点组成，主机通过NAS网络和节点通信，节点与存储系统相连。存储系统中存储的资源供主机使用，主机通过节点申请对资源的锁权限，节点中的锁服务器对锁权限进行管理。

节点和存储设备可以分离，也可以组合在一起。每个节点中有协议服务器和锁代理。来自主机的锁请求可以是基于网络文件系统(Network File System，NFS)协议，或者基于服务信息块(Server Message Block，SMB)协议。协议服务器可以处理来自主机的一种或者多种协议，例如，NFS服务器支持NFS协议、SMB服务器支持SMB协议，不同的协议服务器与上层主机之间的通信工作原理类似。经过协议服务器处理后的锁请求可以被锁代理使用。

如附图1所示，以分布式系统中2个主机，4个节点为例进行说明。主机和节点的数量根据需求可以进行调整，其实现原理相同。主机通过节点访问存储系统。节点中，协议服务器与锁代理一一对应。例如，节点1中协议服务器1和锁代理1一一对应，节点2中协议服务器2和锁代理2一一对应，以此类推。按照对应关系进行协议服务器和锁代理之间的信号传递。

锁服务器可以与协议服务器和锁代理位于同一节点中，也可以单独位于独立的节点中，还可以位于其他节点中。节点内部使用总线等计算机内部协议进行通信。节点之间，可以使用FC、以太网等网络通信。在本发明实施例中，以服务器与协议服务器和锁代理位于一个节点中为例进行说明，例如，节点1中有协议服务器1、锁代理1和锁服务器1。每个锁服务器都可以为不同节点上的锁代理授予不同的锁权限。本节点上的锁代理可以从本节点的锁服务器上申请权限，还可以从其他节点上的锁服务器上申请锁权限。

分布式系统中可以单独设立一个管理节点来控制管理各个节点，也可以由任一节点来兼任控制管理所有节点。管理控制各节点的节点一般为主节点，也可以称之为管理节点。在本发明实施例中，对此不做限定，也未在图中单独示出。

当需要对存储系统中的资源(例如文件、目录、文件块或者数据块)进行读写操作时，主机通过网络发送锁请求给对应的协议服务器。主机可以根据锁请求中携带的信息确定对应的协议服务器，也可以根据IP地址段确定对应的协议服务器，均可以采用现有的实现方式，在本发明实施例中不予限定。协议服务器接收到锁请求之后，将锁请求发送给与这个协议服务器对应的锁代理。

锁代理根据锁服务器管理范围确定由哪个锁服务器处理锁请求，然后将锁请求发送给确定的锁服务器进行处理。锁服务器管理范围可以预先设定，也可以利用哈希一致性环来确定。锁服务器管理范围可以存储在锁代理所在的节点的缓存中；也可以存储在共享存储中，供分布式系统中的锁代理都共享。

例如，锁代理2接收到加锁请求之后，根据本地存储的锁服务器管理范围确定出加锁请求应该有锁服务器3处理，将加锁请求发送给锁服务器3处理。也可以不在本地存储锁服务器的管理范围，而锁请求中携带有文件ID，锁代理通过查询或者计算，就可以知道这个文件的锁权限由哪个锁服务器管理。锁代理也可以直接将锁请求发送给位于同一节点中的锁服务器，同一节点中的锁服务器再根据锁服务器管理范围转发给负责处理该锁请求的锁服务器。例如锁代理2将接收到的加锁请求发送给锁服务器2，锁服务器2根据本地存储的锁服务器管理范围确定该加锁请求应该由锁服务器4负责处理，锁服务器2将该加锁请求转发给锁服务器4处理。这两种处理方式都可以利用现有的技术，在此不再另行描述。

锁服务器存储自己分配的锁权限。锁代理中存储自己向锁服务器所申请的锁权限。当分布式系统中锁服务器管理范围有变动时，分布式系统中的管理节点通知锁服务器和锁代理更新相应的锁服务器管理范围。也可以由管理节点更新锁服务器管理范围之后，把更新结果广播给分布式系统中的各个锁代理和锁服务器。

当锁服务器接收到锁请求之后，在锁服务器处于正常工作状态(即不处于静默状态)期间，锁服务器对锁请求的处理方式与现有技术相同，例如按照锁请求给主机分配锁权限，在此不再另行描述。

本发明实施例中的分布式系统也可以是一个虚拟化的分布式系统，锁服务器运行在虚拟机中。锁代理、协议服务器也可以运行在虚拟机中。由于其功能和非虚拟化环境下完全相同，因此不做单独介绍。

分布式系统中的锁服务器管理范围和锁服务器接管关系可以参见附图2。

如附图2所示，锁服务器在逻辑上组成一个环形。分布式系统中的锁服务器管理范围根据一致性哈希环的逆时针方向(在另外一种实施方式中，也可以采用顺时针方向)来确定，一致性哈希环是通过对分布式系统中锁服务器的ID进行哈希计算得到的。例如分布式系统中锁服务器1的ID为1，锁服务器2的ID为2，锁服务器3的ID为3，锁服务器4的ID为4，各个锁服务器分别对ID利用一致性哈希算法进行哈希计算，并按顺时针方向，将计算结果按从小到大的顺序进行排列，形成一致性哈希环。这样，各个锁服务器中得到的一致性哈希环是相同的。如附图2所示，一致性哈希环为0-232,对锁服务器的ID进行哈希计算得到的结果依次为hash(1)＝5000，hash(2)＝8000，hash(3)＝1024，hash(4)＝512，按顺时针方向，从0开始，锁服务器在哈希环上的位置依次是锁服务器4、锁服务器3、锁服务器1和锁服务器2。此时，锁服务器4的管理范围为(8000-232]和[0-512]，锁服务器3的管理范围为(512，1024]，锁服务器1的管理范围为(1024，5000]，锁服务器2的管理范围为(5000，8000]。此时，在如图2由锁服务器逻辑上组成的环中，按照一致性哈希环的顺时针方向确定锁服务器之间的接管关系，即锁服务器1的接管锁服务器为2，锁服务器2的接管锁服务器为锁服务器4，锁服务器4的接管锁服务器为3，锁服务器3的接管锁服务器为1。

当然，本发明实施例中提出了一种确定锁服务器的接管服务器的方法。需要指出的是，接管关系并不唯一，只要能够使得每一个锁服务器拥有一个接管服务器即可。例如，也可以由管理员配置每个锁服务器的接管服务器，例如：锁服务器1的接管锁服务器配置为锁服务器2，锁服务器2的接管锁服务器配置为锁服务器3，锁服务器3的接管锁服务器配置为锁服务器4，锁服务器4的接管锁服务器配置为锁服务器1。

一个锁服务器可以对多个锁服务器进行接管。例如，如果锁服务器3和锁服务器1同时发生故障，那么它们二者的接管锁服务器为锁服务器4。

在本发明实施例中，锁代理接收到锁请求(例如锁重申请求或者加锁请求)后，根据存储的锁服务器管理范围确定该锁请求应该由哪个锁服务器处理。如果确定处理锁请求的锁服务器发生故障时(锁服务器发生故障时，管理节点会将通知消息广播给分布式系统中的锁代理)，锁代理根据锁服务器接管关系确定接管锁服务器，将锁请求发送给接管锁服务器处理。

锁服务器管理范围和锁服务器接管关系，可以由管理节点统一配置，并发送给所有的锁代理保存；也可以由管理节点计算出一致性哈希环之后发送给各个锁代理，还可以通过管理节点事先配置锁代理，由各个锁代理分别计算得到相同的一致性哈希环。

锁代理接收到锁请求之后，对锁请求中携带的文件标识利用一致性哈希算法进行哈希计算，看计算出的结果落入哪个范围，则由对应的锁服务器负责处理。例如，锁请求为加锁请求，加锁请求中携带的文件标识(例如文件名)为(foo1.txt)，锁代理对(foo1.txt)进行哈希计算，得到的结果为4500，应该由锁服务器1管理，锁代理将加锁请求发送给锁服务器1。再如，锁请求为锁重申请求，重申锁请求中携带的文件信息为(foo8.txt)，锁代理对(foo8.txt)进行哈希计算，得到的结果为9000，应该由锁服务器4管理，锁代理将锁重申请求发送给锁服务器4。

在接管锁服务器处于静默期期间，对于静默范围内的资源，主机可以使用锁重申请求，从接管锁服务器那里重新获得自己以前从故障锁服务器申请的权限。如果接管锁服务器退出静默期后，锁重申请求还没执行完成，则不再执行未执行的锁重申请求。关于锁重申请求的部分，具体可以参见步骤309。

当某个锁服务器发生故障后，锁代理将一致性哈希环中发生故障的锁服务器标识为故障。当锁代理接收到锁请求之后，对锁请求中携带的文件标识进行哈希计算，根据锁服务器管理范围确定计算出来的结果落入哪个锁服务器的管理范围，如果确定出的锁服务器为故障状态，锁代理再根据锁服务器接管关系确定所述故障锁服务器的接管锁服务器，将锁请求发送给接管锁服务器处理。接管锁服务器收到锁请求后，根据文件标识进行哈希计算得到哈希值，发现哈希值落入了自己的接管范围，因此自己需要对锁请求进行处理。如果是其他非锁服务器收到锁请求后，根据文件标识进行哈希计算得到哈希值，发现哈希值没有落入自己的接管范围，那么不做处理。

例如，分布式系统中的锁服务器2发生故障，锁代理在接收到通知消息后将一致性哈希环中的锁服务器2标识为故障。锁代理接收到锁重申请求中携带的文件信息为(foo5.txt)，锁代理对(foo5.txt)进行哈希计算，得到的结果是7000，根据锁管理范围，应该由锁服务器2负责处理。但是锁服务器2此时处于故障状态，根据锁服务器接管关系，故障锁服务器2的接管锁服务器是锁服务器4，因此锁代理将重申锁请求发送给接管锁服务器4处理。锁服务器4对(foo5.txt)进行哈希计算，得到的接管是7000，属于自己的接管范围，因此对锁重申请求进行处理。

当有主机需要对分布式系统中的某个文件进行操作时，主机利用主机上的应用向协议服务器发送锁请求，协议服务器将锁请求发送给对应的锁代理，锁代理对锁请求中携带的文件的标识(标识例如是FSID，或者是FID)进行哈希计算，根据计算结果确定该文件属于哪个锁服务器的管理范围，将锁请求发送给该锁服务器进行相应的处理。对文件的标识进行哈希计算的哈希算法需要与生成一致性哈希环的哈希算法相同。例如，锁请求中携带的文件标识为(foo2.txt)，锁代理对该文件标识(foo2.txt)进行哈希计算，得到结果为6500，我们可以看出，如附图2所示，落入一致性哈希环上的锁服务器1与锁服务器2之间范围，为锁服务器2的管理范围，该锁请求由锁服务器2处理。

当锁服务器2发生故障时，锁代理将一致性哈希环中的锁服务器2标识为故障。此时锁代理接收到锁请求后，对锁请求中携带的文件信息(foo3.txt)进行哈希计算，得到结果为7500，落入一致性哈希环上的锁服务器1与锁服务器2之间范围，但是由于锁服务器2处于故障状态，根据一致性哈希环，锁服务器2的接管锁服务器为锁服务器4，即，范围锁服务器4的管理范围，因此，锁代理将锁请求发送给锁服务器4处理。

根据节点的名称或者锁服务器ID利用一致性哈希算法得到一致性哈希环的方法可以采用已有的技术，在此不再赘述。

基于附图2所示的分布式系统中的锁服务器管理范围和锁服务器接管关系，本发明实施例提供一种分布式系统中锁权限的处理方法，此方法实施例应用于锁服务器，本方法实施例中涉及的协议服务器与锁代理的实现方法流程与前文描述的方法相同，在本方法实施例中不再另行说明，具体的流程如附图3所示。

本方法可以应用在附图1所示的分布式系统。在本发明实施例的分布式系统中，有4个锁服务器，分别为锁服务器1，锁服务器2，锁服务器3和锁服务器4。本实施例中的锁服务器的数量仅是为了示例性的说明，具体数量以实际的业务需要为准，其实现原理和本实施例相同。

下面以接管锁服务器是第一锁服务器，发生故障的锁服务器是第二锁服务器为例对加锁请求的处理进行详细说明，参见附图3。

步骤301，当分布式系统中有锁服务器发生故障时，管理节点会向分布式系统中的锁服务器广播通知消息。本实施例中，发生故障的是第二锁服务器，因此通知消息中携带有第二锁服务器的ID作为第二锁服务器的标识信息。为了与其他的通知消息相区分，将通知有锁服务器发生故障的通知消息称之为第一通知消息。

收到第一通知消息的锁服务器，根据第一通知消息中携带的ID和本地存储的锁服务器管理范围，判断自己是不是第二锁服务器的接管锁服务器，如果是，则针对第二锁服务器原来已分配了权限的资源进入静默状态；否则不进入静默状态。

此外，收到第一消息后，第一锁服务器可以启动定时器。将来在定时器到达预设时间后，第一锁服务器退出静默，更新第一锁服务器的接管关系。

另外一种检测故障的方式是，接管锁服务器按照接管关系信息定时向对应的锁服务器发送检测消息，当检测到对应的锁服务器故障后，进入静默状态。

步骤302：第一锁服务器接收加锁请求，所述加锁请求中携带目标资源的标识。目标资源是需要被加锁的资源，是加锁请求的请求对象，或者说，是等待被分配锁权限的资源。

主机对存储系统中的资源进行读或写等操作时，需要通过协议服务器和锁代理向锁服务器发送加锁请求，加锁请求中携带有请求加锁的资源的资源标识。资源标识可以是需要操作的文件的ID或者是需要操作的逻辑单元号(Logic Unit Number，LUN)的ID，加锁请求所请求的是对资源进行读出或者对资源进行写入的权限。

第一锁服务器根据资源标识，判断请求的资源是否属于自己的管理范围。例如，对资源标识进行哈希运算，如果得到的值属于第一锁服务器预设的哈希值范围，那么就属于第一锁服务器的管理范围；否则，不属于第一锁服务器的管理范围。

加锁请求所请求加锁的目标资源，位于存储系统，由锁服务器对其锁权限进行管理。这个过程在前文已进行了介绍，在此不再另行说明。

如何把原本发送给第二锁服务器的锁请求会发送给第一锁服务器处理。实现办法有很多种，例如在锁服务器和主机直接设置路由器，路由器中记录接管关系，当第二锁服务器发生故障后，路由器把原本发送给第二锁服务器的锁请求发送给第二锁服务器的接管锁服务器。如果和第二锁服务器在同一节点的锁代理没有故障，可以采用前述的方案，由锁代理把原本发送给第二锁服务器的锁请求发送给第二锁服务器的接管锁服务器。

在附图1所示的分布式系统中，假设锁服务器1发生了故障，也就是说锁服务器1为第二锁服务器。根据附图2中所示的锁服务器管理范围和锁服务器接管关系，锁服务器2是锁服务器1的接管锁服务器，那么这里的第一锁服务器是锁服务器2。

步骤303：所述第一锁服务器查询第一资源信息记录表，所述第一资源信息记录表记录有第二锁服务器已分配了锁权限的资源的资源标识。

第二锁服务器的接管锁服务器处于静默状态。包括第一锁服务器在内的各锁服务器，在接收到加锁请求之后，先确认自己目前是否处于静默状态。如果处于静默状态，进一步判断加锁请求中携带的标识，得知这个加锁请求属于自己接管范围内的加锁请求，则执行步骤303。如果收到加锁请求的不是第一锁服务器，而是其他锁服务器，则不执行步骤303，退出整个流程。

节点故障后，节点中的协议服务器成为故障协议服务器。原本通过故障协议服务器访问存储系统的主机，需要改为通过故障协议服务器的接管协议服务器访问存储系统。也就是说，由接管协议服务器接管故障协议服务器的工作。在接管协议服务器完成接管之前，其所在节点处于静默状态(静默范围是故障锁服务器已经分配权限的资源)，在完成接管后，静默节点退出静默状态。此外，如果超出预设的时间后，即使接管未完成，静默节点退出静默状态。

静默锁服务器所在的节点也处于静默状态，也就是说如果节点由锁服务器和协议服务器、锁代理共同组成，那么节点的协议服务器、锁代理也会进入静默状态。在静默期间，接管协议服务器接管故障协议服务器的工作，接管的过程包括：主机通过锁重申请求，重新申请以前通过故障协议服务器拥有的权限。

在现有技术的实现中，处于静默状态的锁服务器，对任何锁请求会直接返回拒绝的响应消息。在本发明实施例中，第一锁服务器在处于静默状态时，会查询第一资源信息记录表。第一资源信息记录表中存储有第二锁服务器已分配了锁权限的资源的资源标识。第一资源信息记录表可以不存储没有锁权限的具体内容，例如具体是读权限还是写权限，因此占用存储空间大大减少。第一资源信息记录表可以存储在第一锁服务器本地；也可以存储在其他服务器中；可以同时存储在第一锁服务器本地和指定的其他服务器中。在进入静默状态之后，将资源信息记录表存储到其他指定的锁服务器中。例如，资源信息记录表存储在第一锁服务器本地，在第一锁服务器进入静默状态之后，第一锁服务器将资源信息记录表发送到第一锁服务器的接管锁服务器中存储。或者在第一锁服务器的资源信息记录发生改变后，及时同步到第一锁服务器的接管锁服务器中存储，保持同步。

在本发明实施例中，锁服务器在首次收到对一个资源的加锁请求时，会把这个资源已经分配了锁权限这一信息，发送给锁服务器的接管锁服务器，在接管锁服务器上把这个信息存入第一资源信息记录表。锁服务器发送这个信息的时机，也可以是在为这个资源分配锁权限之后。如果这个锁服务器后续又收到对同一个资源的锁请求，不论请求的权限是否相同，都不再把这一信息发送给锁服务器的接管锁服务器。

具体的实现办法是：锁服务器每收到一个加锁请求时，判断“这个资源已经分配了锁权限”这一通知信息是否已经发送给锁服务器的接管锁服务器，如果没有，则发出通知消息；否则不发出通知消息。

第一资源信息记录表中除了存储第二锁服务器已分配锁权限的资源的资源标识外，还可以存储第一锁服务器已分配锁权限的资源标识，供第一锁服务器在退出静默状态后处理锁请求时查询。

步骤303之后，执行步骤304或者步骤305。

步骤304：当所述第一资源信息记录表中有所述目标资源标识时，所述第一锁服务器返回拒绝的响应消息。

当资源信息记录表中存储有所述资源标识时，说明该资源已经由第二锁服务器分配了锁权限。此时第一锁服务器不能处理加锁请求，以免造成同一资源的锁权限冲突，第一锁服务器通过锁代理和协议服务器向主机返回拒绝的响应消息。

当然，在另外的实施例中，如果对于另外的加锁请求，经过查询发现已经由第一锁服务器分配了权限的，第一锁服务器也会返回拒绝消息。关于这一点，不再详述。

步骤305：当所述资源信息记录表中没有所述资源标识时，第一锁服务器按照加锁请求所请求的权限为所述资源分配锁权限，通过锁代理和协议服务器向主机返回分配的锁权限。

当第一资源信息记录表中没有存储所述资源标识时，说明该资源标识对应的资源没有被分配过锁权限，此时没有主机在对所述资源标识对应的资源进行操作。因此，第一锁服务器可以为所述资源标识对应的资源分配锁权限。第一锁服务器通过相应的锁代理和协议服务器将分配的锁权限返回给发出请求的主机，允许发出请求的主机对资源进行操作。

这样，通过本发明实施例提供的分布式系统中加锁请求的处理方法，当分布式系统中有锁服务器发生故障时，第二锁服务器的接管锁服务器可以处理一部份加锁请求，只有在请求的资源已经分配了锁权限的情况下，才不能处理针对已分配了锁权限的资源的加锁请求。因此，本实施例把分布式系统中锁服务器发生故障时影响的范围进行了更精确的控制和缩小，提高了分布式系统的性能和可靠性。

在分配了锁权限后，第一锁服务器可以把分配的权限记录在本地的详细资源信息记录表中。详细资源信息记录表中记录有权限的具体内容，例如资源标识、锁权限、锁权限类型、锁权限当前状态。详细资源信息记录表和第一资源信息记录表可以是分离的，也可以是整合在一起的。

在第一锁服务器接管了故障服务器后，第一锁服务器还向非故障节点的锁代理发送查询消息。每个非故障节点的锁代理收到查询消息后，向第一锁服务器发送反馈消息，反馈消息中携带本锁代理通过第二锁服务器申请到的锁权限，并记录到锁服务器的详细资源信息记录表中。因此，详细资源信息记录表中记录的信息得到更新，除了记录第一锁服务器分配的权限的具体内容，还有记录第二锁服务器分配的权限的具体内容。

如前所述，步骤304和305提及的加锁请求，都是按照接管范围原本应该由第二锁服务器处理的加锁请求。即使接管锁服务器进入静默状态，对于按照原本就在接管锁服务器处理范围内的资源不进入静默，对这些资源的加锁请求可以像没有进入静默状态那样处理。

步骤305之后，所述方法实施例还可以执行步骤306。

步骤306：所述第一锁服务器将所述目标资源标识存储到第二资源信息记录表中。所述第二资源信息记录表和第一资源信息记录表的形式类似，用于记录第一锁服务器已分配了锁权限的资源的资源标识。以便当第一锁服务器故障后，第一锁服务器的接管锁服务器可以对第一锁服务器进行接管，具体步骤和步骤302——步骤305类似，此处不详述。

当所述第一锁服务器不处于静默状态时，第一锁服务器在为加锁请求中目标资源分配锁权限之后，将目标资源标识记录到第二资源信息表中。第二资源信息表存储的是第一锁服务器分配了锁权限的资源的资源标识。

通过执行步骤306，当第一锁服务器故障，所述第一锁服务器的接管锁服务器从非静默状态转换到静默状态，静默范围是第一锁服务已分配权限的资源。对于第一锁服务器的接管锁服务器收到的加锁请求，如果第二资源信息记录表中未记录目标资源标识时，第一锁服务器的接管锁服务器即可按照步骤305的操作为所述目标资源分配锁权限；反之，则像步骤304一样，返回拒绝的响应消息。

在现有技术的实现中，锁服务器给资源分配锁权限之后，会在锁服务器本地存储必要的信息，例如资源标识、锁权限、锁权限类型、锁权限当前状态等，在此不再另行说明。在本发明实施例中，锁服务器为资源分配锁权限之后，还将分配了锁权限的资源的资源标识另外单独存储。可选的，锁服务器将资源标识存储在单独的一个资源信息记录表中，并将所述资源信息记录表存储到锁服务器的接管锁服务器中。

可选的，步骤304或者步骤306之后，所述方法实施例还可以包括以下步骤307。

步骤307，退出静默状态。

所有锁代理都已经把通过第二锁服务器申请的锁请求内容上报给了第一锁服务器后，意味着接管工作已经完成，也可以提前退出静默。

此外，可以预设一个接管时间，到达预定的时间时，不论接管工作是否完成，所述第一锁服务器退出静默状态。

退出静默状态后，可以更新第一锁服务器管理范围和锁服务器接管关系。第一锁服务器新的管理范围发生了扩大，是自己旧的管理范围和第二锁服务器的管理范围这二者的集合。本步骤执行后，完成了第一锁服务器对第二锁服务器的接管。相应的，系统中的接管范围也要发生改变，比如第一锁服务器的接管锁服务器(命名为第三锁服务器)的接管范围也要随着第一锁服务器的管理范围机械能更新。

分布式系统中的锁服务器接收到第一通知消息之后，可以启动定时器，当到达预定的时间时，处于静默状态的锁服务器退出静默状态。如前文所述，第一通知消息是管理节点通过广播的方式发出，用于通知分布式系统中的锁服务器有锁服务器发生故障。当分布式系统中的非第二锁服务器接收到第一通知消息之后，根据本地或者共享存储中存储的锁服务器接管关系确定自己是否为第二锁服务器的接管锁服务器；如果是第二锁服务器的接管锁服务器，则进入静默状态，并启动定时器。当到达预定的时间时，退出静默状态，更新锁服务器管理范围和锁服务器接管关系；如果不是第二锁服务器的接管锁服务器，则不进入静默状态，保持正常工作。

此外，在接收到第一通知消息之后，非接管锁服务器还可以将本地存储的锁服务器管理范围和锁服务器接管关系中的第二锁服务器标示为故障状态，非接管锁服务器更新锁服务器管理范围和锁服务器接管关系。

分布式系统中锁服务器更新锁服务器管理范围和锁服务器接管关系的算法相同，具体方式可以如前文所述的对锁服务器的ID进行哈希运算得到，在此不再详述。

更新接管关系的触发方式由多种。也可以由管理节点触发。也就是说，在接收到管理节点的通知消息之后，锁服务器更新管理范围和锁服务器接管关系。这样，管理节点需要启动定时器，当定时器到达预定的时间时，向分布式系统中广播通知消息。分布式系统中可以正常工作的非第二锁服务器接收到管理节点的通知消息后，分别更新本地存储的锁服务器管理范围和锁服务器接管关系。

可选的，步骤307之后可以包括以下步骤：

步骤308，所述第一锁服务器退出静默状态后，删除第一资源信息记录表。

第一资源信息记录表可以存储在第一锁服务器的本地，也可以存储在其他服务器中。当存储在其他服务器中时，第一锁服务器可以通知其他服务器删除第一资源信息记录表。

第一资源信息记录表中记录的是第二锁服务器已经分配了锁权限的资源的资源标识，其内容例如是：“资源ID：已分配权限”。当第一锁服务器接管第二锁服务器的锁业务之后，即第一锁服务器进入静默状态，当接收到加锁请求时，第一锁服务器根据第一资源信息记录表来确定是否为加锁请求中携带的资源标识对应的资源分配锁权限。当第一锁服务器退出静默状态之后，即按正常的流程处理加锁请求，此时第一资源信息记录表中记录的信息不再作为如何处理锁请求的依据，因此，此时可以将第一资源信息记录表删除。这样，可以将存储信息最小化，尽量少的占用分布式系统的系统资源，将对分布式系统性能的影响减小到最小。

如前所述，在静默后，第一锁服务器可以对静默范围内的资源的锁重申请求继续处理。因此，第一锁服务器在步骤301和步骤307之间，还可以包括步骤309。

步骤309，第一锁服务器接收锁重申请求，所述锁重申请求中携带另一目标资源的标识，以及所述另一目标资源由所述第二锁服务器分配的锁权限，其中，第二锁服务器分配的锁权限是在第二锁服务器故障之前给另一目标资源分配的。接着，第一锁服务器按照所述第二锁服务器已经分配的锁权限，给所述另一目标资源重新分配锁权限，重新分配的锁权限和第二锁服务器在故障前给另一目标资源分配的锁权限相同。显然，重新分配的锁权限的权限拥有者也与之前的权限拥有者相同。锁重申请求是由主机发起的，第一锁服务器在退出静默之前，可以对多个锁重申请求进行处理。退出静默后，不再处理锁重申请求。

例如，第二锁服务器在给权限拥有者分配了对某个资源写权限后发生故障，第一锁服务器在收到锁重申请求后，再次给权限拥有者分配对这个资源的写权限。在本发明实施例中，锁服务器给资源首次分配了锁权限之后，将分配了锁权限的资源的资源标识存储到接管锁服务器中，当锁服务器发生故障时，处于静默状态的第二锁服务器的接管锁服务器根据存储的资源标识判断是否可以处理接收到的加锁请求。这样，可以将锁服务器发生故障时影响到的加锁请求的范围减小到最小，而且由于只存储了资源标识，占用很少的系统资源，对系统的性能影响也很小，提高了整个分布式系统的稳定性和可靠性。

在上文提到的方法中，为了实现精简备份，尽量少的占用系统资源，只将分配了锁权限的资源的资源标识进行了备份。在系统资源允许的情况下，也可以将锁服务器上的信息进行完全备份。即将某个锁服务器的详细资源信息记录表全部备份，例如备份到第一锁服务器的接管锁服务器上。此时的处理方法与前述方法原理类似，只是备份的信息更多，将占用较多的系统资源。但是由于第一锁服务器上备份有完整的锁权限，因此在接管第二锁服务器时，不需要所有节点上的锁代理重新上报已经申请的锁权限给接管锁服务器。也就是说，步骤305中提及的，第一锁服务器还向非故障节点的锁代理发送查询消息的步骤可以省去，因此可以将静默时间缩至最短。

上述方法可以应用在虚拟化分布式系统中。此外，在虚拟化分布式系统中，锁服务器运行在虚拟机中。

在虚拟化场景中，如果把一个锁服务器的接管锁服务器设置为在一个物理节点中，那么当前一个锁服务器故障时，由于同一个物理节点中数据传输的更快，可以缩短接管时间。

在虚拟化场景中，当第二锁服务器所在的节点恢复正常时，可以在节点上部署新的锁服务器。可以直接将所述另一第一锁服务器迁移到该节点上，即修改所述另一第一锁服务器的地址映射关系；也可以在该节点上创建新的锁服务器，将另一第一锁服务器上的锁业务迁移到新创建的锁服务器中。在虚拟化分布式系统中，为了简化操作，直接将另一第一锁服务器迁移到节点上即可。

分布式系统中锁服务器的锁服务器管理范围和锁服务器接管关系满足一定条件下，可以进行更新。如前文所述的，当分布式系统中有锁服务器发生故障后，非故障锁服务器将依据预定的规则更新锁服务器管理范围和锁服务器接管关系。另外，可以由管理节点通知分布式系统中的非第二锁服务器更新锁服务器管理范围和锁服务器接管关系，也可以由管理节点更新锁服务器接管关系之后，将更新后的锁服务器接管关系广播给分布式系统中的锁服务器。例如，当有新的锁服务器加入时，管理节点通知分布式系统中的锁服务器分别更新锁服务器接管关系。

更新接管关系基于两种可能：一种是有锁服务器发生故障，或者其他原因不再使用；另一种是有新的锁服务器加入。下面对这两种情况分别说明。

结合前文所述的方法实施例，分布式系统中的非第二锁服务器在接收到管理节点的第一通知消息后(所述第一通知消息用于通知分布式系统中的非第二锁服务器分布式系统中有锁服务器发生了故障)，分布式系统中的各非故障锁服务器将更新自己的锁服务器管理范围和锁服务器接管关系。非第二锁服务器可以依据预先设定的方法(如一致性哈希算法)来更新自己的锁服务器管理范围和锁服务器接管关系，也可以由管理节点更新了锁服务器管理范围和锁服务器接管关系之后广播给分布式系统中的锁服务器。非第二锁服务器的锁服务器管理范围和锁服务器接管关系可以存储在非第二锁服务器本地，也可以存储在共享存储中，在本方法实施例中不做限定。

当分布式系统中有新的锁服务器加入时，分布式系统中的锁服务器也需要更新自己的锁服务器管理范围和锁服务器接管关系。分布式系统中的锁服务器接收第二通知消息，所述第二通知消息中携带新加入的锁服务器的标识。分布式系统中的锁服务器更新自己的锁服务器管理范围和锁服务器接管关系。

当分布式系统中有新的锁服务器加入时，管理节点向分布式系统中的锁服务器发送第二通知消息，第二通知消息中携带有新加入的锁服务器的ID。锁服务器(包括新加入的锁服务器)接收到第二通知消息后，根据预定的规则(如一致性哈希算法)计算得到新的锁服务器管理范围和锁服务器接管关系。同样的，也可以由管理节点更新锁服务器管理范围和锁服务器接管关系之后，将更新后的锁服务器管理范围和锁服务器接管关系发送给分布式系统中的各个锁服务器。

当锁服务器管理范围和锁服务器接管关系更新后，各锁服务器根据更新后的锁服务器管理范围和锁服务器接管关系来确定自己新的备份锁服务器，将需要存储的资源信息记录表或者资源标识发送给新的备份锁服务器。

本发明实施例还提供了处理锁请求的锁请求管理装置4，锁管理装置4例如是锁服务器，其结构如附图4所示。可以应用于附图3以及上述方法实施例，由于在方法实施例以及对应的附图3中已经有了详细的说明，因此下面仅简单描述锁管理装置4各模块的功能，详细功能均可参考前面的方法实施例。多个锁请求管理装置4可以组成一种在分布式锁管理系统。

所述锁服务器4包括接收模块41、存储模块42以及锁请求处理模块43，以及静默模块44。

其中，接收模块41，用于接收第一加锁请求和通知消息，所述第一加锁请求中携带有第一资源标识；存储模块42，用于存储另一锁请求管理装置的锁管理范围，以及第一资源信息记录表，所述第一资源信息记录表中记录有已被所述另一锁请求管理装置分配了锁权限的资源的资源标识；锁请求处理模块43，用于处理所述存储模块42接收到的加锁请求；静默模块44，用于在通过所述通知消息获知所述另一锁请求管理装置发生故障后，将所述锁请求管理装置4设置为静默状态，静默范围是所述另一锁请求管理装置已经分配过权限的资源；其中，所述锁请求处理模块43，在进入所述静默状态后，具体用于：当所述加锁请求属于所述静默范围时，查询第一资源信息记录表，如果所述第一资源信息记录表中未记录所述第一资源标识，则所述按照所述第一加锁请求给所述第一资源分配锁权限。

可选的，在所述锁请求管理装置4进入静默状态后：所述接收模块41还用于接收第二加锁请求,所述第二加锁请求用于请求给第二资源加锁，所述第二加锁请求中携带有第二资源的标识；所述锁请求处理模块43还用于，在检测到所述第二资源属于所述锁请求管理装置4的管理范围后，按照所述第二加锁请求给所述第二资源分配锁权限。

可选的，在所述锁请求管理装置4进入所述静默状态后：所述接收模块41还用于接收第三加锁请求,所述第三加锁请求用于请求给第三资源加锁，所述第三加锁请求中携带有第三资源的标识；所述锁请求处理模块43还用于，在检测到到所述第三资源属于所述另一锁请求管理装置的管理范围后，查询第一资源信息记录表，如果所述第一资源信息记录表中已经记录所述第三加锁请求所请求的资源的资源标识，则拒绝按照第三加锁请求给第三资源分配锁权限。

可选的，在所述锁请求管理装置进入静默状态之后，所述锁请求处理模块43还用于：接收锁重申请求，所述锁重申请求中携带第四资源的标识，以及所述第四资源由所述另一锁请求管理装置分配的权限，所述第四资源是所述另一锁请求管理装置已经分配过权限的资源；按照所述另一锁请求管理装置已经分配的权限，给所述第四资源重新分配相同的权限。

可选的，所述存储模块42，还用于接收第一通知消息，所述第一通知消息中携带有所述另一锁请求管理装置的标识信息；所述接收模块41，还用于根据所述另一锁请求管理装置的标识和锁请求管理装置4接管关系，确定所述锁请求管理装置是所述另一锁请求管理装置的接管锁请求管理装置4之后，发送另一锁请求管理装置的锁管理范围给所述存储模块42；而前述所述存储模块42用于存储所述另一锁请求管理装置的锁管理范围，具体包括：所述存储模块42用于从所述接收模块41接收所述另一锁请求管理装置的锁管理范围并进行存储。

可选的，所述锁请求管理装置4还可以进一步包括协议服务器模块45和锁代理模块46：所述协议服务器模块45，用于接收来自主机的报文，并从所述报文中解析出所述第一加锁请求，把所述第一加锁请求转发给所述锁代理模块46；所述锁代理模块46，用于根据第一加锁请求中携带的第一资源标识进行判断，当判断出的管理所述第一资源的是所述锁请求处理模块43时，通过所述接收模块41把所述第一加锁请求发送给所述锁请求处理模块43。

可选的，所述静默模块44还用于：在给所述另一锁请求管理装置已经分配过权限的资源全部重新分配权限后，所述锁请求管理装置退出静默状态；或者，在达到预设时间后，所述锁请求管理装置4退出静默状态。

可选的，所述存储模块42还用于，在所述锁请求管理装置4退出静默状态之后：更新所述锁请求管理装置的管理范围，更新后的所述锁请求管理装置的管理范围，包括更新前的所述锁请求管理装置的管理范围以及所述另一锁请求管理装置的管理范围。

本发明实施例还提供了另一种在分布式系统中服务器5，其结构如附图5所示。服务器5包括：接口51、存储器52以及处理器53。服务器5可以执行方法实施例中的方法，具体而言，是由其处理器53执行方法的步骤。接口51提供对外的数据接口，而存储器52提供数据存储空间。下面仅对其简单介绍，具体内容从参见前文。

接口51，提供对外接口，例如接收加锁请求、锁重申请求。

存储器52，被配置为用于存储另一服务器的锁管理范围，以及第一资源信息记录表，所述第一资源信息记录表中记录有已被所述另一服务器分配了锁权限的资源的资源标识。由方法实施例可知，存储器52还可以用于存储其他信息，例如第二资源信息记录表、详细资源信息记录表。还可以用于存储另一服务器的锁管理范围。

处理器53，被配置为用于通过运行出程序执行方法实施例中各个步骤。例如：在获知所述另一服务器发生故障后将所述服务器设置为静默状态，其中，所述静默状态的静默范围是另一服务器的已经分配过权限的资源；接收第一加锁请求，所述第一加锁请求用于请求给第一资源加锁，所述第一加锁请求中携带有第一资源标识；检测到所述第一资源属于所述另一锁服务器的管理范围；所述第一锁服务器查询第一资源信息记录表，如果所述第一资源信息记录表中未记录所述第一资源标识，则所述第一锁服务器按照所述第一加锁请求给所述第一资源分配锁权限。

方法实施例中的各个操作均可以由处理器53执行。例如静默、退出静默、查询、判断以及分配权限等。

可选的，服务器5还可以进一步协议服务器模块54和锁代理模块55。

其中，协议服务器模块54，用于接收来自主机的报文，并从所述报文中解析出所述第一加锁请求；以及还用于把所述第一加锁请求转发给锁代理模块。锁代理模块55，用于根据第一加锁请求中携带的第一资源标识进行判断，当判断出管理所述第一资源的是所述服务器5时，把所述第一加锁请求发送给所述接口。

本发明各实施例涉及的“表”，例如第一资源信息记录表并不是限定它的形式是表格或者表单。而是以其存储的内容作为它的定义。

本发明的各个方面、或各个方面的可能实现方式可以被具体实施为系统、方法或者计算机程序产品。因此，本发明的各方面、或各个方面的可能实现方式可以采用完全硬件实施例、完全软件实施例(包括固件、驻留软件等等)，或者组合软件和硬件方面的实施例的形式，在这里都统称为“电路”、“模块”或者“系统”。此外，本发明的各方面、或各个方面的可能实现方式可以采用计算机程序产品的形式，计算机程序产品是指存储在计算机可读介质中的计算机可读程序代码。

计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质包含但不限于电子、磁性、光学、电磁、红外或半导体系统、设备或者装置，或者前述的任意适当组合，如随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或者快闪存储器)、光纤、便携式只读存储器(CD-ROM)。

计算机中的处理器读取存储在计算机可读介质中的计算机可读程序代码，使得处理器能够执行在流程图中每个步骤、或各步骤的组合中规定的功能动作；生成实施在框图的每一块、或各块的组合中规定的功能动作的装置。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

一种锁请求的处理方法，其特征在于，应用于第一锁服务器，其中，所述第一锁服务器是第二锁服务器的接管锁服务器，所述第一锁服务器存储有所述第二锁服务器的锁管理范围，该方法包括：

所述第一锁服务器在获知所述第二锁服务器发生故障后进入静默状态，所述静默状态的静默范围是第二锁服务器已经分配过权限的资源；

第一锁服务器接收第一加锁请求，所述第一加锁请求用于请求给第一资源加锁，所述第一加锁请求中携带有第一资源标识；

所述第一锁服务器检测到所述第一资源属于所述第二锁服务器的管理范围；

所述第一锁服务器查询第一资源信息记录表，所述第一资源信息记录表记录有已被所述第二锁服务器分配了锁权限的资源的资源标识，如果所述第一资源信息记录表中未记录所述第一资源标识，则所述第一锁服务器按照所述第一加锁请求给所述第一资源分配锁权限。
根据权利要求1所述的锁请求的处理方法，其中，在所述第一锁服务器进入所述静默状态后，所述方法还包括：

所述第一锁服务器接收第二加锁请求，所述第二加锁请求用于请求给第二资源加锁，所述第二加锁请求中携带有第二资源的标识；

所述第一锁服务器检测到所述第二资源属于所述第一锁服务器的管理范围；

所述第一锁服务器按照所述第二加锁请求给所述第二资源分配锁权限。
根据权利要求1所述的锁请求的处理方法，其中，在所述第一锁服务器进入所述静默状态后，所述方法还包括：

第一锁服务器接收第三加锁请求，所述第三加锁请求用于请求给第三资源加锁，所述第三加锁请求中携带有第三资源的标识；

所述第一锁服务器检测到所述第三资源属于所述第二锁服务器的管理范围；

所述第一锁服务器查询第一资源信息记录表，如果所述第一资源信息记录表中已经记录所述第三加锁请求所请求的资源的资源标识，则所述第一锁服务器拒绝按照第三加锁请求给第三资源分配锁权限。
根据权利要求1-3中任一所述的锁请求的处理方法，其中，所述方法还包括：

所述第一锁服务器将所述第一资源标识记录到第二资源信息记录表中；

其中，所述第二资源信息记录表用于记录所述第一锁服务器已分配了锁权限的资源的资源标识，所述第二资源信息记录表存储在第三锁服务器中。
根据权利要求1-3中任一所述的锁请求的处理方法，其中，所述第一锁服务器存储所述第二锁服务器的锁管理范围的步骤包括：

所述第一锁服务器接收第一通知消息，所述第一通知消息中携带有所述第二锁服务器的标识信息；

所述第一锁服务器根据所述第二锁服务器的标识和锁服务器接管关系，确定所述第一锁服务器为所述第二锁服务器的接管锁服务器；

所述第一锁服务器接收所述第二锁服务器的锁管理范围并进行存储。
根据权利要求1-3中任一所述的锁请求的处理方法，其中，所述方法之前，还包括：

协议服务器接收来自主机的报文，并从所述报文中解析出所述第一加锁请求；

所述协议服务器把所述第一加锁请求转发给锁代理；

所述锁代理根据第一加锁请求中携带的第一资源标识进行判断，当判断出管理所述第一资源的是所述第一锁服务器时，把所述第一加锁请求发送给所述第一锁服务器。
根据权利要求1-3中任一所述的锁请求的处理方法，其中，所述第一锁服务器进入静默状态之后，所述方法还包括：

接收锁重申请求，所述锁重申请求中携带第四资源的标识，以及所述第四资源由所述第二锁服务器分配的权限，所述第四资源是所述第二锁服务器已经分配过权限的资源；

按照所述第二锁服务器已经分配的权限，给所述第四资源重新分配相同的权限。
根据权利要求7中所述的锁请求的处理方法，所述方法还包括：

在给所述第二锁服务器已经分配过权限的资源全部重新分配权限后，所述第一锁服务器退出静默状态；或者

在达到预设时间后，所述第一锁服务器退出静默状态。
根据权利要求8所述的锁请求的处理方法，其中，所述第一锁服务器退出所述静默状态之后，所述方法还包括：

所述第一锁服务器更新所述第一锁服务器的管理范围，更新后的所述第一锁服务器的管理范围，包括更新前的所述第一锁服务器的管理范围以及所述所述第二锁服务器的管理范围。
一种锁请求管理装置，其特征在于，用于接管另一锁请求管理装置的锁请求，包括：

接收模块，用于接收第一加锁请求和通知消息，所述第一加锁请求中携带有第一资源标识；

存储模块，用于存储另一锁请求管理装置的锁管理范围，以及第一资源信息记录表，所述第一资源信息记录表中记录有已被所述另一锁请求管理装置分配了锁权限的资源的资源标识；

锁请求处理模块，用于处理所述存储模块接收到的加锁请求；

静默模块，用于在通过所述通知消息获知所述另一锁请求管理装置发生故障后，将所述锁请求管理装置设置为静默状态，静默范围是所述另一锁请求管理装置已经分配过权限的资源；

其中，所述锁请求处理模块，在进入所述静默状态后，具体用于：

当所述加锁请求属于所述静默范围时，查询第一资源信息记录表，如果所述第一资源信息记录表中未记录所述第一资源标识，则所述按照所述第一加锁请求给所述第一资源分配锁权限。
根据权利要求10所述的锁请求管理装置，其中，在所述锁请求管理装置进入静默状态后：

所述接收模块还用于接收第二加锁请求,所述第二加锁请求用于请求给第二资源加锁，所述第二加锁请求中携带有第二资源的标识；

所述锁请求处理模块还用于，在检测到所述第二资源属于所述锁请求管理装置的管理范围后，按照所述第二加锁请求给所述第二资源分配锁权限。
根据权利要求10所述的锁请求管理装置，其中，在所述锁请求管理装置进入所述静默状态后：

所述接收模块还用于接收第三加锁请求,所述第三加锁请求用于请求给第三资源加锁，所述第三加锁请求中携带有第三资源的标识；

所述锁请求处理模块还用于，在检测到到所述第三资源属于所述另一锁请求管理装置的管理范围后，查询第一资源信息记录表，如果所述第一资源信息记录表中已经记录所述第三加锁请求所请求的资源的资源标识，则拒绝按照第三加锁请求给第三资源分配锁权限。
根据权利要求10-12任一所述的锁请求管理装置，其中：

所述接收模块，还用于接收第一通知消息，所述第一通知消息中携带有所述另一锁请求管理装置的标识信息；

所述接收模块，还用于根据所述另一锁请求管理装置的标识和锁请求管理装置接管关系，确定所述锁请求管理装置是所述另一锁请求管理装置的接管锁请求管理装置之后，发送另一锁请求管理装置的锁管理范围给所述存储模块；

所述存储模块用于存储所述另一锁请求管理装置的锁管理范围，具体包括：

所述存储模块用于从所述接收模块接收所述另一锁请求管理装置的锁管理范围并进行存储。
根据权利要求10-12任一所述的锁请求管理装置，其中，所述锁请求管理装置还包括协议服务器模块和锁代理模块：

所述协议服务器模块，用于接收来自主机的报文，并从所述报文中解析出所述第一加锁请求，把所述第一加锁请求转发给所述锁代理模块；

所述锁代理模块，用于根据第一加锁请求中携带的第一资源标识进行判断，当判断出的管理所述第一资源的是所述锁请求处理模块时，通过所述接收模块，把所述第一加锁请求发送给所述锁请求处理模块。
根据权利要求10-12任一所述的锁请求管理装置，其中，所述锁请求处理模块还用于，在所述锁请求管理装置进入静默状态之后：

接收锁重申请求，所述锁重申请求中携带第四资源的标识，以及所述第四资源由所述另一锁请求管理装置分配的权限，所述第四资源是所述另一锁请求管理装置已经分配过权限的资源；

按照所述另一锁请求管理装置已经分配的权限，给所述第四资源重新分配相同的权限。
根据权利要求15述的锁请求管理装置，所述静默模块还用于：

在给所述另一锁请求管理装置已经分配过权限的资源全部重新分配权限后，所述锁请求管理装置退出静默状态；或者

在达到预设时间后，所述锁请求管理装置退出静默状态。
根据权利要求16所述的锁请求管理装置，其中，所述存储模块还用于，在所述锁请求管理装置退出静默状态之后：

更新所述锁请求管理装置的管理范围，更新后的所述锁请求管理装置的管理范围，包括更新前的所述锁请求管理装置的管理范围以及所述另一锁请求管理装置的管理范围。
一种服务器，服务器是另一服务器的锁管理接管服务器，包括：

接口，被配置为用于接收加锁请求；

存储器，被配置为用于存储另一服务器的锁管理范围，以及第一资源信息记录表，所述第一资源信息记录表中记录有已被所述另一服务器分配了锁权限的资源的资源标识；

处理器，被配置为用于通过运行出程序执行以下步骤：

在获知所述另一服务器发生故障后将所述服务器设置为静默状态，其中，所述静默状态的静默范围是另一服务器的已经分配过权限的资源；

接收第一加锁请求，所述第一加锁请求用于请求给第一资源加锁，所述第一加锁请求中携带有第一资源标识；

检测到所述第一资源属于所述另一锁服务器的管理范围；

所述第一锁服务器查询第一资源信息记录表，如果所述第一资源信息记录表中未记录所述第一资源标识，则所述第一锁服务器按照所述第一加锁请求给所述第一资源分配锁权限。
根据权利要求18所述的服务器，其中，在所述服务器进入所述静默状态后，所述方法还包括：

所述服务器接收第二加锁请求，所述第二加锁请求用于请求给第二资源加锁，所述第二加锁请求中携带有第二资源的标识；

所述服务器检测到所述第二资源属于所述服务器的管理范围；

所述服务器按照所述第二加锁请求给所述第二资源分配锁权限。
根据权利要求18所述的服务器，其中，在所述服务器进入所述静默状态后，所述处理器还被配置为执行：

接收第三加锁请求，所述第三加锁请求用于请求给第三资源加锁，所述第三加锁请求中携带有第三资源的标识；

检测到所述第三资源属于所述另一服务器的管理范围；

查询第一资源信息记录表，如果所述第一资源信息记录表中已经记录所述第三加锁请求所请求的资源的资源标识，则拒绝按照第三加锁请求给第三资源分配锁权限。
根据权利要求18-20任一所述的服务器，其中，所述存储器用于存储所述另一服务器的锁管理范围，具体包括：

所述处理器用于接收第一通知消息，所述第一通知消息中携带有所述另一服务器的标识信息；

所述处理器用于根据所述另一服务器的标识和服务器接管关系，确定所述服务器为所述另一服务器的接管服务器后，将所述另一服务器的锁管理范围发送给所述存储器；

所述存储器，用于接收所述另一服务器的锁管理范围并进行存储。
根据权利要求18-20任一所述的服务器，其中，所述服务器还用于：

协议服务器模块，用于接收来自主机的报文，并从所述报文中解析出所述第一加锁请求；

所述协议服务器模块，还用于把所述第一加锁请求转发给锁代理模块；

所述锁代理模块根据第一加锁请求中携带的第一资源标识进行判断，当判断出管理所述第一资源的是所述服务器时，把所述第一加锁请求发送给所述接口。
根据权利要求18-20任一所述的服务器，其中，所述服务器进入静默状态之后，所述处理器还用于：

接收锁重申请求，所述锁重申请求中携带第四资源的标识，以及所述第四资源由所述另一服务器分配的权限，所述第四资源是所述另一服务器已经分配过权限的资源；

按照所述另一服务器已经分配的权限，给所述第四资源重新分配相同的权限。
根据权利要求23所述的服务器，所述处理器还用于：

在给所述另一服务器已经分配过权限的资源全部重新分配权限后，将所述服务器退出静默状态；或者

在达到预设时间后，将所述服务器退出静默状态。
根据权利要求24所述的服务器，其中，所述服务器退出所述静默状态之后，所述处理器还被配置为执行：

更新所述服务器的管理范围，更新后的所述服务器的管理范围，包括更新前的所述服务器的管理范围以及所述所述另一服务器的管理范围。