CN116360696A - 分布式块存储系统、介质及其电子设备 - Google Patents

分布式块存储系统、介质及其电子设备 Download PDF

Info

Publication number
CN116360696A
CN116360696A CN202310335385.6A CN202310335385A CN116360696A CN 116360696 A CN116360696 A CN 116360696A CN 202310335385 A CN202310335385 A CN 202310335385A CN 116360696 A CN116360696 A CN 116360696A
Authority
CN
China
Prior art keywords
virtual volume
server
metadata management
management server
storage system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310335385.6A
Other languages
English (en)
Other versions
CN116360696B (zh
Inventor
朱伟鹏
徐文豪
王弘毅
张凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SmartX Inc
Original Assignee
SmartX Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SmartX Inc filed Critical SmartX Inc
Priority to CN202310335385.6A priority Critical patent/CN116360696B/zh
Publication of CN116360696A publication Critical patent/CN116360696A/zh
Application granted granted Critical
Publication of CN116360696B publication Critical patent/CN116360696B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0611Improving I/O performance in relation to response time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0617Improving the reliability of storage systems in relation to availability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/062Securing storage systems
    • G06F3/0622Securing storage systems in relation to access
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提供一种分布式块存储系统、介质及其电子设备,包括:元数据管理服务器,所述元数据管理服务器包括若干虚拟卷;若干存储服务器,每个所述存储服务器均与所述元数据管理服务器连接,用于根据用户指令,对所述虚拟卷执行读写操作;每个所述虚拟卷存在至多一个拥有对应访问权限的所述存储服务器,以作为所述虚拟卷的关联存储服务器。本发明实现只有一个存储服务器拥有与一致性快照组中的虚拟卷访问权限,且虚拟卷的访问权限中设置了时效性,减少了每次访问都要请求元数据管理服务器的次数。

Description

分布式块存储系统、介质及其电子设备
技术领域
本发明涉及信息技术领域,具体地,涉及一种分布式块存储系统、介质及其电子设备。
背景技术
分布式块存储系统大多数都提供了对虚拟卷创建快照(保存某一时刻虚拟卷的数据)的能力,一些对安全性要求高的业务,通常会进行定时快照,以便出现问题时,可以将数据回滚到某一个时间点的快照,保护数据安全。一些情况下,一个业务可能会使用多个虚拟卷来存储不同类别的数据,为了确保此类业务能整体回滚到某一个时间点,分布式块存储系统提供了一致性快照组功能,以实现同一时间对多个虚拟卷创建快照,确保多个卷的数据在时间上的一致性。
在单机块存储系统中,由于虚拟卷和读写操作都由一台机器管理,从客户端发过来的IO不需要通过网络,直接读取内存即可感知到虚拟机是否被锁住,因此在单机存储系统中,一致性组打快照是高效的,正确性也容易得到保证。
因此,在现有技术中存在两个问题:
(1)在分布式块存储系统中,虚拟卷存储在元数据管理服务器中,读写操作则由存储服务器处理,一致性组中多个虚拟卷的读写操作可能由不同的存储服务器处理,这就导致一致性快照组较难直接实现同一时刻为在不同的服务器上处理虚拟卷产生快照,以达成应用程序需要的一致性效果。
(2)一致性快照组需要锁住多个虚拟卷,锁的动作一般由元数据管理服务器完成,那么存储服务器在处理读写操作时就需要感知到一致性组内的虚拟卷被锁住了,这需要存储服务去感知虚拟卷的状态,但如果每个读写操作都去向元数据管理服务器检查虚拟卷是否被锁住,会给元数据管理器带来巨大压力,导致读写操作延迟过大。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种分布式块存储系统、介质及其电子设备。
第一方面,本申请本发明提供的一种分布式块存储系统、介质及其电子设备,包括:元数据管理服务器,所述元数据管理服务器包括若干虚拟卷;若干存储服务器,每个所述存储服务器均与所述元数据管理服务器连接,用于根据用户指令,对所述虚拟卷执行读写操作;其中,每个所述虚拟卷存在至多一个拥有对应访问权限的所述存储服务器,以作为所述虚拟卷的关联存储服务器。
优选的,在任意一个所述存储服务器根据所述用户指令对目标虚拟卷执行所述读写操作前,由当前所述存储服务器判断自身是否具有所述目标虚拟卷的对应访问权限:若存在,则直接对所述目标虚拟卷执行所述读写操作;若不存在,则向所述元数据管理服务器进行访问权限请求。
优选的,所述元数据管理服务器还用于对所述虚拟卷的所述对应访问权限进行管理,其中:在接收到所述访问权限请求的情况下,判断所述目标虚拟卷是否具有所述关联存储服务器;若不存在,则将所述目标虚拟卷的对应访问权限授予当前所述存储服务器,并将当前所述存储服务器作为所述目标虚拟卷的所述关联存储服务器;若存在,则将所述目标虚拟卷的所述关联存储服务器的地址反馈至当前所述存储服务器;当前所述存储服务器根据所述地址将所述用户指令对应的所述读写操作转发至所述目标虚拟卷的所述关联存储服务器,并由所述关联存储服务器执行所述读写操作。
优选的,所述虚拟卷的对应访问权限具有时效性;所述关联存储服务器通过与所述元数据管理服务器的心跳连接实现对所述对应访问权限的时效更新。
优选的,所述元数据管理服务器还用于对所述虚拟卷的一致性快照创建进行管理,其中:将若干所述虚拟卷纳入一致性快照组中;根据接收到的一致性快照请求,拒绝所述一致性快照组中全部所述虚拟卷对应的所述访问权限请求;回收所述一致性快照组中全部所述虚拟卷的所述对应访问权限;为所述一致性快照组中的全部所述虚拟卷创建统一快照。
优选的,在所述一致性快照创建完成的情况下,所述元数据管理服务器重新开始接收所述访问权限请求。
优选的,所述元数据管理服务器还用于对所述虚拟卷的一致性快照回滚进行管理,其中:将若干所述虚拟卷纳入一致性快照回滚组中;根据接受到的一致性快照回滚请求,拒绝所述一致性快照回滚组中全部所述虚拟卷对应的所述访问权限请求;回收所述一致性快照回滚组中全部所述虚拟卷的所述对应访问权限;为所述一致性快照回滚组中的全部虚拟卷进行回滚。
优选的,在所述一致性快照回滚完成的情况下,所述元数据管理服务器重新开始接收所述访问权限请求。
第二方面,本申请提供了一种电子设备,其特征在于,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现所述的分布式块存储系统。
第三方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任意一项所述的分布式块存储系统。
与现有技术相比,本发明具有如下的有益效果:
(1)本发明通过对虚拟卷的访问权限的限制,实现在创建/回滚一致性快照组时,冻结一致性快照组内虚拟卷的读写操作访问权限的申请,保证所有虚拟卷所在时间的一致性;
(2)本发明实现了只有一个存储服务器拥有与一致性快照组中的虚拟卷访问权限,并且虚拟卷的访问权限中设置了时效性,减少了每次访问都要请求元数据管理服务器的次数,若在有访问权限的条件下且在时效性内,不需要重新向元数据管理服务器重新申请,减少了每次读写操作的开销,并能够通过周期性心跳来维持访问权限的时效性。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明分布式块存储系统中虚拟卷的访问权限授权的流程图;
图2为本发明分布式块存储系统中创建一致性快照组的流程示意图;
图3为本发明分布式块存储系统中创建一致性快照回滚组的流程示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
一般的,分布式块存储系统是将数据分散存储在多台独立的服务器,传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。而分布式块存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用元数据管理服务进行副本分配,恢复和迁移,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
进一步的,分布式块存储系统大多数都提供了对虚拟卷创建快照(保存某一时刻虚拟卷的数据)的能力,一些对安全性要求高的业务,通常会进行定时快照,以便出现问题时,可以将数据回滚到某一个时间点的快照,保护数据安全。
一般的,分布式块存储提供了虚拟卷供用户使用,用户可以通过存储协议(如iSCSI等)将虚拟卷挂载到虚拟机或者计算节点。
在单机块存储系统中,由于虚拟卷和数据读写操作都由一台机器管理,从客户端发过来的数据读写操作不需要通过网络,直接读取内存即可感知到虚拟机是否被锁住,因此在单机存储系统中,一致性组打快照是高效的,正确性也容易得到保证。
而在分布式块存储系统中,虚拟卷存储在元数据管理服务中,数据读写操作则由存储服务器处理,一致性组中多个虚拟卷的数据读写操作可能由不同的存储服务器处理,这就导致一致性快照组较难直接实现同一时刻为在不同的服务器上处理虚拟卷产生快照,以达成应用程序需要的一致性效果。
具体而言,一致性快照组需要锁住多个虚拟卷,锁的动作一般由元数据管理服务器完成,那么存储服务在处理数据读写操作时,就需要感知到一致性组内的虚拟卷被锁住了,这需要存储服务器去感知虚拟卷的状态。如果每个数据读写操作都去向元数据管理服务器检查虚拟卷是否被锁住,会给元数据管理带来巨大压力,导致数据读写操作延迟过大。
参照图1~3,本专利旨在解决上述问题,提供了一种分布式块存储系统,其包括元数据管理服务器和若干存储服务器,元数据管理服务器包括若干虚拟卷,用户可以通过存储协议(如iSCSI等)将虚拟卷挂载到虚拟机或者计算节点。
元数据管理服务器将虚拟卷分割为多个小数据块,每个小数据块都具有一定大小的内存(如256MB)。元数据管理服务器创建快照时标记虚拟卷的每个小数据块为写时复制,并保存到快照元数据数据管理服务器中。写时复制原理为:当虚拟卷快照后的写某一个小数据块的读写操作下发到存储服务器时,为虚拟卷新申请一个小数据块并替换原小数据块,同时复制原来的小数据块到新小数据块,最后将读写操作写入新小数据块。
每个存储服务器均与元数据管理服务器连接,用于根据用户指令,对虚拟卷执行读写操作。
需要说明的是,为了避免数据竞争,每个虚拟卷存在至多一个拥有对应访问权限的存储服务器,以作为虚拟卷的关联存储服务器。因此,在本发明中设定了虚拟卷的访问权限,通过访问权限的限定来控制数据竞争。
因此,在任意一个存储服务器根据用户指令对目标虚拟卷执行读写操作前,由当前存储服务器判断自身是否具有目标虚拟卷的对应访问权限,如图1所示;
若存在,则直接对目标虚拟卷执行读写操作;
若不存在,则向元数据管理服务器进行访问权限请求。
进一步的,为了实现在保障多服务器接入提供高可用能力的情况下任意一个虚拟卷仅由单一存储服务处理请求的效果,元数据管理服务器还用于对虚拟卷的对应访问权限进行管理,其中:
在接收到访问权限请求的情况下,判断目标虚拟卷是否具有关联存储服务器;
若不存在,则将目标虚拟卷的对应访问权限授予当前存储服务器,并将当前存储服务器作为目标虚拟卷的关联存储服务器;
若存在,则将目标虚拟卷的关联存储服务器的地址反馈至当前存储服务器,当前存储服务器根据地址将用户指令对应的读写操作转发至目标虚拟卷的关联存储服务器,并由关联存储服务器执行读写操作。
因为设置了虚拟卷的访问权限,导致存储服务处理器每次需要进行读写操作时,均需要向元数据管理服务器获取虚拟卷的状态,为了提高性能,虚拟卷的对应访问权限具有时效性,也就是元数据服务器授予当前拥有访问权限的存储服务器一个过期时间,在这个时间段没有过期的时候,关联存储服务器缓存了权限,无需再次申请,如果这个时间端过期了,关联存储服务器通过于元数据管理服务器的心跳连接实现对对应访问权限的时效更新。
通过对虚拟卷访问权限的限制,实现了在后续创建/回滚一致性快照组时,元数据管理服务同时锁住多个虚拟卷,冻结虚拟卷的读写操作的效果。
一些情况下,一个业务可能会使用多个虚拟卷来存储不同类别的数据,例如一个数据总线类的应用,数据通常会保存在不同的虚拟卷上,只有所有虚拟卷的快照数据属于同一个时刻,它们才是可以互相验证有效的。为了确保此类业务能整体回滚到某一个时间点,分布式块存储系统提供了一致性快照组功能,以实现同一时间对多个虚拟卷创建快照,确保多个虚拟卷的数据在时间上的一致性。
进一步的,参照图2,图2为分布式块存储系统中创建一致性快照组的流程图,元数据管理服务器还用于对虚拟卷的一致性快照创建进行管理,包括:
将若干虚拟卷纳入一致性快照组中;
根据接收到的一致性快照请求,拒绝一致性快照组中全部虚拟卷对应的访问权限请求;
回收一致性快照组中全部虚拟卷的对应访问权限,也就是下发命令将所有存储服务器上的一致性快照组内的虚拟卷访问权限清空,清空后的存储服务器将无法读写操作,直到元数据管理服务器创建一致性快照组完成。
为一致性快照组中的全部虚拟卷创建统一快照,在创建一致性快照组期间,冻结了一致性快照组中所有虚拟卷的读写操作,存储服务器无法对一致性快照组内任意一个虚拟卷下发读写操作,因此保证了创建的一致性快照组对多个虚拟卷来说是一致的。需要说明的是,在一致性快照创建完成的情况下,元数据管理服务器重新开始接收访问权限请求。
优选的,参照图3,元数据管理服务器还用于对虚拟卷的一致性快照回滚进行管理,包括:
将若干虚拟卷纳入一致性快照回滚组中。
根据接受到的一致性快照回滚请求,拒绝一致性快照回滚组中全部虚拟卷对应的访问权限请求,也就是冻结一致性快照回滚组内虚拟卷的访问权限的申请,然后下发命令将所有存储服务器上的一致性快照回滚组内的虚拟访问权限清空。
回收一致性快照回滚组中全部虚拟卷的对应访问权限;
为一致性快照回滚组中的全部虚拟卷进行回滚,在一致性快照回滚组期间冻结了一致性快照回滚组内所有虚拟卷的读写操作,存储服务器无法对一致性快照回滚组内任意一个虚拟卷下发到读写操作到物理磁盘,因此可以保证回滚后多个虚拟卷回到同一个快照时刻。
在一致性快照回滚完成的情况下,元数据管理服务器重新开始接收访问权限请求。
元数据管理服务通过快照回滚虚拟卷时,将虚拟卷的小数据块替换为快照记录的小数据块,有写读写操作时再次触发写时复制。
在本申请的一些实施例中,还提供了一种电子设备。该种电子设备中包含存储器和处理器,其中存储器用于对处理程序进行存储,处理器则根据指令对处理程序进行执行。当处理器对处理程序进行执行时,使得前述实施例中的对静态随机存取存储芯片的实时自检测方法得以实现。
本申请提出的技术方案涉及方法、装置、系统、芯片、电子设备、计算机可读存储介质和/或计算机程序产品。计算机程序产品可以包括用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (10)

1.一种分布式块存储系统,其特征在于,包括:
元数据管理服务器,所述元数据管理服务器包括若干虚拟卷;
若干存储服务器,每个所述存储服务器均与所述元数据管理服务器连接,用于根据用户指令,对所述虚拟卷执行读写操作;
其中,每个所述虚拟卷存在至多一个拥有对应访问权限的所述存储服务器,以作为所述虚拟卷的关联存储服务器。
2.根据权利要求1所述的分布式块存储系统,其特征在于,在任意一个所述存储服务器根据所述用户指令对目标虚拟卷执行所述读写操作前,由当前所述存储服务器判断自身是否具有所述目标虚拟卷的对应访问权限:
若存在,则直接对所述目标虚拟卷执行所述读写操作;
若不存在,则向所述元数据管理服务器进行访问权限请求。
3.根据权利要求2所述的分布式块存储系统,其特征在于,所述元数据管理服务器还用于对所述虚拟卷的所述对应访问权限进行管理,其中:
在接收到所述访问权限请求的情况下,判断所述目标虚拟卷是否具有所述关联存储服务器;
若不存在,则将所述目标虚拟卷的对应访问权限授予当前所述存储服务器,并将当前所述存储服务器作为所述目标虚拟卷的所述关联存储服务器;
若存在,则将所述目标虚拟卷的所述关联存储服务器的地址反馈至当前所述存储服务器;
当前所述存储服务器根据所述地址将所述用户指令对应的所述读写操作转发至所述目标虚拟卷的所述关联存储服务器,并由所述关联存储服务器执行所述读写操作。
4.根据权利要求1至3中任意一项所述的分布式块存储系统,其特征在于,所述虚拟卷的对应访问权限具有时效性;
所述关联存储服务器通过与所述元数据管理服务器的心跳连接实现对所述对应访问权限的时效更新。
5.根据权利要求3所述的分布式块存储系统,其特征在于,所述元数据管理服务器还用于对所述虚拟卷的一致性快照创建进行管理,其中:
将若干所述虚拟卷纳入一致性快照组中;
根据接收到的一致性快照请求,拒绝所述一致性快照组中全部所述虚拟卷对应的所述访问权限请求;
回收所述一致性快照组中全部所述虚拟卷的所述对应访问权限;
为所述一致性快照组中的全部所述虚拟卷创建统一快照。
6.根据权利要求5所述的分布式块存储系统,其特征在于,在所述一致性快照创建完成的情况下,所述元数据管理服务器重新开始接收所述访问权限请求。
7.根据权利要求5所述的分布式块存储系统,其特征在于,所述元数据管理服务器还用于对所述虚拟卷的一致性快照回滚进行管理,其中:
将若干所述虚拟卷纳入一致性快照回滚组中;
根据接受到的一致性快照回滚请求,拒绝所述一致性快照回滚组中全部所述虚拟卷对应的所述访问权限请求;
回收所述一致性快照回滚组中全部所述虚拟卷的所述对应访问权限;
为所述一致性快照回滚组中的全部虚拟卷进行回滚。
8.根据权利要求7所述的分布式块存储系统,其特征在于,在所述一致性快照回滚完成的情况下,所述元数据管理服务器重新开始接收所述访问权限请求。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至8中任意一项所述的分布式块存储系统。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任意一项所述的分布式块存储系统。
CN202310335385.6A 2023-03-31 2023-03-31 分布式块存储系统、介质及其电子设备 Active CN116360696B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310335385.6A CN116360696B (zh) 2023-03-31 2023-03-31 分布式块存储系统、介质及其电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310335385.6A CN116360696B (zh) 2023-03-31 2023-03-31 分布式块存储系统、介质及其电子设备

Publications (2)

Publication Number Publication Date
CN116360696A true CN116360696A (zh) 2023-06-30
CN116360696B CN116360696B (zh) 2024-01-23

Family

ID=86923144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310335385.6A Active CN116360696B (zh) 2023-03-31 2023-03-31 分布式块存储系统、介质及其电子设备

Country Status (1)

Country Link
CN (1) CN116360696B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117009294A (zh) * 2023-08-21 2023-11-07 北京志凌海纳科技有限公司 分布式文件系统中一致性快照实现方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1453715A (zh) * 2002-04-26 2003-11-05 株式会社日立制作所 拥有虚拟资源的存储系统
CN1664793A (zh) * 2005-03-11 2005-09-07 清华大学 基于元数据服务器的存储虚拟化管理方法
US20190384514A1 (en) * 2018-06-15 2019-12-19 EMC IP Holding Company LLC Storage management method, electronic device and computer program product
CN111124301A (zh) * 2019-12-18 2020-05-08 深圳供电局有限公司 一种对象存储设备的数据一致性存储方法及系统
US20220188043A1 (en) * 2020-12-11 2022-06-16 Nutanix, Inc. Vblock metadata management
CN115277145A (zh) * 2022-07-20 2022-11-01 北京志凌海纳科技有限公司 分布式存储访问授权管理方法、系统、设备和可读介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1453715A (zh) * 2002-04-26 2003-11-05 株式会社日立制作所 拥有虚拟资源的存储系统
CN1664793A (zh) * 2005-03-11 2005-09-07 清华大学 基于元数据服务器的存储虚拟化管理方法
US20190384514A1 (en) * 2018-06-15 2019-12-19 EMC IP Holding Company LLC Storage management method, electronic device and computer program product
CN111124301A (zh) * 2019-12-18 2020-05-08 深圳供电局有限公司 一种对象存储设备的数据一致性存储方法及系统
US20220188043A1 (en) * 2020-12-11 2022-06-16 Nutanix, Inc. Vblock metadata management
CN115277145A (zh) * 2022-07-20 2022-11-01 北京志凌海纳科技有限公司 分布式存储访问授权管理方法、系统、设备和可读介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FANG, WC ET AL.: "High Performance Metadata Management Engine for Large-Scale Distributed File Systems", 2015 9TH INTERNATIONAL CONFERENCE ON FUTURE GENERATION COMMUNICATION AND NETWORKING *
李必刚;舒继武;穆飞;郑纬民;: "一种基于集群环境的虚拟存储系统研究与实现", 小型微型计算机系统, no. 06 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117009294A (zh) * 2023-08-21 2023-11-07 北京志凌海纳科技有限公司 分布式文件系统中一致性快照实现方法

Also Published As

Publication number Publication date
CN116360696B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
US10552372B2 (en) Systems, methods, and computer-readable media for a fast snapshot of application data in storage
US10831741B2 (en) Log-shipping data replication with early log record fetching
US10599535B2 (en) Restoring distributed shared memory data consistency within a recovery process from a cluster node failure
US9424140B1 (en) Providing data volume recovery access in a distributed data store to multiple recovery agents
US10534769B2 (en) Maintaining consistency between a transactional database system and a non-transactional content repository for document objects
US10445186B1 (en) Associating a guest application within a virtual machine to create dependencies in backup/restore policy
US10795579B2 (en) Methods, apparatuses, system and computer program products for reclaiming storage units
US10055309B1 (en) Parallel restoration of a virtual machine's virtual machine disks
CN106777394B (zh) 一种集群文件系统
US11347426B2 (en) Point in time copy of time locked data in a storage controller
CN116360696B (zh) 分布式块存储系统、介质及其电子设备
CN106357703B (zh) 集群切换方法与设备
US20200089411A1 (en) Reduction of processing overhead for point in time copy to allow access to time locked data
US9924002B1 (en) Managing stateless processes
WO2020040958A1 (en) Providing consistent database recovery after database failure for distributed databases with non-durable storage leveraging background synchronization point
US10168932B2 (en) Collision detection at multi-node storage sites
US20200285409A1 (en) Extent Lock Resolution In Active/Active Replication
US8850126B2 (en) Exclusive access during a critical sub-operation to enable simultaneous operations
US9632700B2 (en) Managing a shared storage system using hardware identifiers to deter data/file corruption
JP2018536247A (ja) クラウドベースのセッション管理システム
US10394677B2 (en) Method to efficiently and reliably process ordered user account events in a cluster
US11341159B2 (en) In-stream data load in a replication environment
US20190278747A1 (en) System and method to optimally apply local retention in a remote repository
US10083067B1 (en) Thread management in a storage system
US10514961B1 (en) Enhanced cookie management for file workflows

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant