CN112099728A - 一种执行写操作、读操作的方法及装置 - Google Patents

一种执行写操作、读操作的方法及装置 Download PDF

Info

Publication number
CN112099728A
CN112099728A CN201910528337.2A CN201910528337A CN112099728A CN 112099728 A CN112099728 A CN 112099728A CN 201910528337 A CN201910528337 A CN 201910528337A CN 112099728 A CN112099728 A CN 112099728A
Authority
CN
China
Prior art keywords
client
storage resource
data
read
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910528337.2A
Other languages
English (en)
Other versions
CN112099728B (zh
Inventor
罗四维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201910528337.2A priority Critical patent/CN112099728B/zh
Priority to PCT/CN2020/088787 priority patent/WO2020253407A1/zh
Publication of CN112099728A publication Critical patent/CN112099728A/zh
Application granted granted Critical
Publication of CN112099728B publication Critical patent/CN112099728B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0611Improving I/O performance in relation to response time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种执行写操作、读操作的方法及装置。该方法包括:服务器接收客户端发送的写请求,所述写请求中包含所述客户端的标识和待写入的数据;所述服务器根据所述客户端的标识以及保存的客户端的标识与分配的存储资源之间的对应关系,确定为所述客户端分配的存储资源后,将所述待写入的数据存储到所述存储资源,所述服务器创建所述客户端的标识与所述存储资源所位于的物理地址之间的对应关系。该方法由服务器确定存储所述待写入的数据的位置,并将所述待写入数据存储到所述位置,不需要协调节点确定存储待写入数据的位置以及将所述位置通知给所述客户端,减少了写操作过程的交互流程,有效提升写操作的效率。

Description

一种执行写操作、读操作的方法及装置
技术领域
本申请涉及通信技术领域,尤其涉及一种执行写操作、读操作的方法及装置。
背景技术
分布式存储系统经常需要实现多节点集群操作,例如需要实现多个客户端同时读写同一份数据。现有技术中分布式存储系统进行多节点集群操作时,系统架构一般如图1所示,客户端通过协调节点将IO请求转发给集群服务器,执行IO请求的处理。其中,所述客户端执行写操作时,具体步骤如图2所示,客户端向对应的协调节点发送写请求,所述协调节点接收到所述写请求后向集群管理节点请求处理所述写请求的分区。所述集群管理节点根据当前系统负载情况确定用于处理此次写请求的分区,其中,所述分区中包括3个服务器。然后,所述协调节点根据所述集群管理节点分配的分区以及所述写请求中包含的数据信息,为所述客户端分配数据写入的地址,并将所述分区以及所述写入地址通知给所述客户端。所述客户端根据所述协调节点通知的所述分区以及所述写入地址,将所述写请求中包含的数据信息分别写入所述分区中的3个服务器的对应位置,并在完成数据写入后通知给所述协调节点本次数据写入的结束位置。
上述分布式存储系统实现多节点集群操作的方法存在的主要问题是:客户端与集群服务器间需要通过协调节点进行消息转发,交互流程较多,容易产生延迟。其中,因为协调节点同一时刻能处理的客户端数量有限,容易造成系统瓶颈,并且如果协调节点出现故障,则会影响系统业务的正常运行。而当同一时刻有众多客户端进行IO操作时,需要协调节点逐一的分配写入位置,从而存在客户端进行IO操作时所述协调节点无法及时处理所述客户端的IO请求,造成客户端进行IO请求延迟的问题。
发明内容
本申请提供一种执行写操作、读操作的方法及装置,用以避免现有技术通过协调节点进行消息转发,交互流程较多,容易产生延迟及造成系统瓶颈的问题。
第一方面,本申请实施例提供一种执行写操作的方法,服务器接收第一客户端发送的第一写请求,所述第一写请求包含所述第一客户端的标识和第一待写入的数据;所述服务器接收第二客户端发送的第二写请求,所述第二写请求包含所述第二客户端的标识和第二待写入的数据;所述服务器根据所述第一客户端的标识以及保存的客户端的标识与分配的存储资源之间的对应关系,确定为所述第一客户端分配的存储资源是第一存储资源;所述服务器根据所述第二客户端的标识以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述第二客户端分配的存储资源是第二存储资源,其中所述第二存储资源所位于的物理地址不同于所述第一存储资源所位于的物理地址;所述服务器将所述第一待写入的数据存储到所述第一存储资源中,并且将所述第二待写入的数据存储到所述第二存储资源中;所述服务器创建所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系,以及所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系。
基于该方案,分布式存储系统在进行写操作时,所述服务器接收到所述客户端发送的写请求后,根据保存的客户端的标识与分配的存储资源之间的对应关系以及所述写请求中包含的所述客户端的标识确定为所述客户端分配的存储资源;从而将所述写请求中包含的待写入的数据存储到对应的存储资源中。在进行写操作过程中,由服务器确定存储所述待写入的数据的位置,并将所述待写入数据存储到所述位置,不需要协调节点确定存储待写入数据的位置以及将所述位置通知给所述客户端。减少了信息传递,有效降低现有技术中进行写操作过程交互流程较多,容易产生延迟的问题,以及因为协调节点同一时刻能处理的客户端数量有限,容易造成系统瓶颈的问题,所以可有效提升写操作的效率。
在一种可能的实现方式中,所述服务器创建所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系,以及所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系之后,所述服务器将所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系发送给所述第一客户端,以及将所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系发送给所述第二客户端。
基于该方案,所述服务器将所述客户端的标识与对应存储资源所位于的物理地址之间的对应关系发送给所述客户端,从而可以在所述客户端需要向所述服务器发送读请求时,确定需要读取的数据的起始位置。
相应地,所述服务器接收所述第一客户端发送的第一读请求,所述第一读请求中包含所述第一客户端的标识、第一待读取的数据的起始位置及长度;所述服务器接收所述第二客户端发送的第二读请求,所述第二读请求中包含所述第二客户端的标识、第二待读取的数据的起始位置及长度;所述服务器根据所述第一读请求确定所述第一待读取的数据,并将所述第一待读取的数据发送给所述第一客户端,以及根据所述第二读请求确定所述第二待读取的数据,并将所述第二待读取的数据发送给所述第二客户端。
基于该方案,所述服务器接收到读请求之后,根据所述读请求中的客户端标识,第一待读取的数据的起始位置及长度,确定待读取的数据,从而读取对应的数据,并将读取的数据发送给客户端。
在一种可能的实现方式中,所述服务器将所述第一待写入的数据存储到所述第一存储资源中,并且将所述第二待写入的数据存储到所述第二存储资源中之前,所述服务器若确定所述第一存储资源中剩余的存储空间大小小于所述第一待写入的数据的大小时,为所述第一客户端继续分配至少一个第三存储资源,并记录所述第一客户端的标识与所述至少一个第三存储资源的标识的对应关系;所述服务器若确定所述第二存储资源中剩余的存储空间大小小于所述第二待写入的数据的大小时,为所述第二客户端继续分配至少一个第四存储资源,并记录所述第二客户端的标识与所述至少一个第四存储资源的标识的对应关系;所述服务器将所述第一待写入的数据存储到所述第一存储资源中,并且将所述第二待写入的数据存储到所述第二存储资源中包括:所述服务器将所述第一待写入的数据中的部分数据存储到所述第一存储资源中,并将所述第一待写入的数据中的剩余部分数据存储到所述第三存储资源中;所述服务器将所述第二待写入的数据中的部分数据存储到所述第二存储资源中,并将所述第二待写入的数据中的剩余部分数据存储到所述第四存储资源中。
基于该方案,所述服务器在进行数据存储前,先判断当前存储资源的剩余空间是否足够存储所述数据,若是,则直接将所述数据存储在所述存储资源中,若否,则创建新的存储资源。从而,所述服务器可根据实际情况实时创建存储资源,有效减少了内存占用。
第二方面,本申请实施例还提供一种执行读操作的方法,服务器接收第一客户端发送的第一读请求,所述第一读请求中包含所述第一客户端的标识、第一待读取的数据的起始位置及长度;所述服务器接收所述第二客户端发送的第二读请求,所述第二读请求中包含所述第二客户端的标识、第二待读取的数据的起始位置及长度;所述服务器根据所述第一读请求确定所述第一待读取的数据,并将所述第一待读取的数据发送给所述第一客户端,以及根据所述第二读请求确定所述第二待读取的数据,并将所述第二待读取的数据发送给所述第二客户端。
基于该方案,分布式存储系统在进行读操作时,所述服务器接收到所述客户端发送的读请求后,根据所述读请求中的客户端标识,待读取的数据的起始位置及长度等信息,从而读取对应的数据,并将读取的数据发送给所述客户端。
在一种可能的实现方式中,所述服务器根据所述第一读请求确定所述第一待读取的数据,以及根据所述第二读请求确定所述第二待读取的数据,包括:所述服务器根据所述第一客户端的标识,确定为所述第一客户端分配的存储资源是第一存储资源;所述服务器根据所述第二客户端的标识,确定为所述第二客户端分配的存储资源是第二存储资源;所述服务器根据所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系以及所述第一待读取的数据的起始位置及长度,从所述第一存储资源中确定所述第一待读取的数据;所述服务器根据所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系以及所述第二待读取的数据的起始位置及长度,从所述第二存储资源中确定所述第二待读取的数据。
基于该方案,所述服务器接收到读请求之后,根据所述读请求中的客户端标识,第一待读取的数据的起始位置及长度,确定待读取的数据,从而读取对应的数据,并将读取的数据发送给客户端。
在一种可能的实现方式中,所述服务器根据所述第一客户端的标识,确定为所述第一客户端分配的第一存储资源以及根据所述第二客户端的标识,确定为所述第二客户端分配的第二存储资源,包括:所述服务器根据所述第一客户端的标识,以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述第一客户端分配的存储资源是所述第一存储资源;所述服务器根据所述第二客户端的标识,以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述第二客户端分配的存储资源是所述第二存储资源。
基于该方案,提供了一种所述服务器在接收到读请求之后,根据所述客户端的标识,确定为所述客户端分配的存储资源的方法。即所述服务器根据所述客户端的标识,以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述客户端分配的存储资源。
第三方面,本申请实施例还提供一种执行写操作的装置,该装置可以为分布式存储系统中的服务器,该装置可以用来执行上述第一方面及第一方面的任意可能的实现方式中的操作。例如,装置可以包括用于执行上述第一方面或第一方面的任意可能的实现方式中的各个操作的模块或单元。比如包括处理单元和通信单元。
第四方面,本申请实施例还提供了一种执行读操作的装置,该装置可以为分布式存储系统中的客户端,该装置可以用来执行上述第二方面及第二方面的任意可能的实现方式中的操作。例如,装置可以包括用于执行上述第二方面或第二方面的任意可能的实现方式中的各个操作的模块或单元。比如包括处理单元和通信单元。
第五方面,本申请实施例还提供一种分布式存储系统,包括上述第三方面的服务器和上述第四方面的客户端。
第六方面,本申请实施例提供了一种芯片系统,包括处理器,可选的还包括存储器;其中,存储器用于存储计算机程序,处理器用于从存储器中调用并运行计算机程序,使得安装有芯片系统的通信设备执行上述第一方面或第一方面的任意可能的实现方式中的任一方法;和/或,使得安装有芯片系统的通信设备执行上述第二方面或第二方面的任意可能的实现方式中的任一方法。
第七方面,本申请实施例提供了一种计算机程序产品,计算机程序产品包括:计算机程序代码,当计算机程序代码被通信设备的通信单元、处理单元或收发器、处理器运行时,使得通信设备执行上述第一方面或第一方面的任意可能的实现方式中的任一方法;和/或,使得安装有芯片系统的通信设备执行上述第二方面或第二方面的任意可能的实现方式中的任一方法。
第八方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有程序,程序使得通信设备(例如,分布式存储系统中的服务器)执行上述第一方面或第一方面的任意可能的实现方式中的任一方法;和/或,使得安装有芯片系统的通信设备(例如,分布式存储系统中的客户端)执行上述第二方面或第二方面的任意可能的实现方式中的任一方法。
附图说明
图1为现有技术中分布式存储系统进行多节点操作的系统架构示意图;
图2为现有技术执行写操作的示意图;
图3a为本申请提供的一种执行写操作的系统示意图;
图3b、图3c为本申请提供的第一种执行写操作的存储方式示意图;
图4为本申请提供一种执行写操作的流程示意图;
图5为本申请提供一种数据写入过程发生故障示意图;
图6a为本申请提供的第一种执行读操作的读取情况示意图;
图6b为本申请提供的第二种执行读操作的读取情况示意图;
图7为本申请提供一种执行读操作的流程示意图;
图8为本申请提供的第一种执行写操作的装置示意图;
图9为本申请提供的第二种执行写操作的装置示意图;
图10为本申请提供的一种执行写操作的方法示意图;
图11为本申请提供的第一种执行读操作的装置示意图;
图12为本申请提供的第二种执行读操作的装置示意图;
图13为本申请提供的一种执行读操作的方法示意图。
具体实施方式
目前,分布式存储系统中执行写操作的方法一般是:需要进行写操作的至少一个客户端向对应的协调节点请求分配进行处理的服务器。所述协调节点分别为需要进行写操作的客户端确定进行处理的服务器并分配本次数据写入的起始位置。需要进行写操作的至少一个客户端根据对应协调节点分配的服务器以及分配的本次数据写入的起始位置写入数据,并在完成数据写入后通知给所述协调节点本次数据写入的结束位置。这样经过协调节点的中间协调以及信息传递,就可以实现写操作。
但是,上述分布式存储系统实现多节点集群操作的方法存在的主要问题是:客户端与集群服务器间需要通过协调节点进行消息转发,交互流程较多,容易产生延迟。其中,因为协调节点同一时刻能处理的客户端数量有限,容易造成系统瓶颈,并且如果协调节点出现故障,则会影响系统业务的正常运行。而当同一时刻有众多客户端进行IO操作时,需要协调节点逐一的分配写入位置,从而存在客户端进行IO操作时所述协调节点无法及时处理所述客户端的IO请求,造成客户端进行IO请求延迟的问题。
例如,上述图1中,客户端1、客户端2、客户端3需要同时进行写操作,则所述客户端1、客户端2、客户端3分别向协调节点请求分配进行处理的服务器。因为协调节点需要逐一的为客户端分配写入的位置,则不可避免的会产生有的客户端优先被分配写入的位置,有的客户端一直在等待协调节点分配写入的位置。从而造成部分客户端进行写操作时发生延迟的问题。这种现象尤其当客户端请求进行写操作的数量增加时而越发突出。
为解决该问题,本申请实施例提供一种执行写操作的方法。可应用于任何需要执行写操作的分布式存储系统中。本申请实施例的基础思想就是在分布式存储系统中进行写操作时,去掉通过协调节点进行消息转发以及通过协调节点分配写入位置的步骤。即本申请实施例中整体系统架构中不再需要协调节点,从而尽量减少交互流程以及消息的转发次数。与此同时,通过本申请实施例进行写操作时可直接向集群管理节点分配的服务器进行写操作,无需等待协调节点分配写入的起始位置,有效的减少等待延迟的时间。
首先介绍本申请实施例可以应用的场景,本申请实施例可以应用于任何具备有存储功能的通信系统中,比如分布式存储系统等。如图3a所示,为本申请实施例可以应用的一种分布式存储系统,具体可以包括客户端(客户端1、客户端2…..客户端7)、集群管理节点以及服务器(服务器1、服务器2和服务器3)。其中,客户端(比如客户端1)用于向集群管理节点发送写请求;集群管理节点用于根据服务器1至服务器3当前的处理资源情况,比如服务器当前的忙闲情况、存储资源情况等为客户端1分配一个服务器(比如服务器2),并将分配的服务器2的标识发给客户端1;这样客户端1就可以直接向服务器2发送写请求(包括待写入数据),避免像现有技术一样还需要再发送请求到协调节点,导致协调节点容易成为瓶颈的问题;服务器2用于首先判断是否已为客户端1分配有存储资源,如果没有则直接为客户端1先分配一块存储资源,然后将待写入数据存储到为客户端1分配的存储资源中;如果预先已经为客户端1分配有存储资源,则在为客户端1分配的存储资源中的空闲区域存储待写入数据。可选的,服务器2还可以将待写入数据的存储地址信息携带在写请求响应消息中反馈给客户端1。此外,服务器2在成功写入待写入数据之后,还可以创建客户端1的标识与所述待写入数据写入的物理地址之间的对应关系。
当然,后续客户端1还可以用于向服务器发送读取求,其中,所述读请求中包含所述客户端标识、需要读取数据的起始位置及长度等信息;服务器2接收到读请求之后,根据所述读请求中的客户端标识,以及创建的客户端的标识与所述待写入数据写入的物理地址之间的对应关系,找到读请求对应的存储地址信息,再结合读取数据的起始位置及长度等信息,进行读取对应的数据,并将读取的数据发送给客户端1。
通过图3a所示的分布式存储系统进行IO处理时,客户端可以直接将IO请求发送给集群管理节点,从而向集群管理节点分配的服务器请求执行IO处理。
进一步的,当分布式存储系统进行IO处理时,所述分布式存储系统中同一时间可能会有多个客户端需要执行IO处理。例如,图3a所示中,当前共有7个客户端需要执行IO处理。其中,客户端1、客户端2、客户端3、客户端5需要执行IO处理中的读操作。客户端4、客户端6、客户端7需要执行IO处理中的写操作。
在本申请实施例中,客户端1、客户端2、客户端3、客户端5可以直接向集群管理节点发送分配进行读操作的服务器请求。然后,客户端1、客户端2、客户端3、客户端5根据集群管理节点发送的分配信息确定执行所述写请求的服务器,并向分配的所述服务器发送读请求。客户端4、客户端6、客户端7可以直接向集群管理节点发送分配进行写操作的服务器请求,然后,客户端4、客户端6、客户端根据集群管理节点发送的分配信息确定执行所述写请求的服务器,并向所述服务器发送写请求。
其中,客户端接收到的集群管理节点发送的所述分配信息确定进行IO处理的服务器,例如所述分配信息中包含所述服务器的IP地址信息,从而客户端可以根据所述服务器的IP地址信息确定进行IO处理的服务器。从图3a中可以看出,客户端1、客户端2对应执行读操作的服务器为服务器1。客户端3、客户端5对应执行读操作的服务器为服务器2。客户端4、客户端6和客户端7对应的执行读操作的服务器为服务器3。
从而服务器1在接收到客户端1、客户端2发送的读请求后,确定所述读请求中对应的数据,并将所述数据返回对应的客户端1、客户端2。同理,服务器2接收到客户端3、客户端5发送的读请求后,确定所述读请求中对应的数据,并将所述数据返回对应的客户端3、客户端5。服务器3接收到客户端4、客户端6以及客户端7发送的写请求后,将所述写请求中对应的数据存储到对应位置中,并向所述客户端4、客户端6以及客户端7返回执行结果。
以下再对本申请实施例中涉及的部分用语进行解释说明,以便于理解。
1)节点(node),是指分布式存储系统中的设备。所述节点可以分为存储节点和访问节点,所述存储节点用于存储数据,所述访问节点用于访问存储节点中的数据。具体地,所述节点可以是上述图3a所示系统中的客户端、集群管理节点或服务器等。
其中,为了保证数据均匀存储在各个存储节点中,在选择存储节点时通常采用分布式哈希表(Distributed Hash Table,DHT)方式进行路由,但本申请实施例对此并不限定。也就是说,在本申请实施例的技术方案中,可以采用存储系统中的各种可能的路由方式。按照分布式哈希表方式,将哈希环均匀地划分为若干部分,每个部分称为一个分区(partition),每个分区对应一段设定大小的存储空间。可以理解的是,分区越多,每个分区所对应的存储空间越小,分区越少,每个分区所对应的存储空间越大。
2)集群管理节点,用于管理分布式存储系统中分区的分配,提供分区变更管理、集群管理,如扩容、缩容、升级等相关功能。
其中,在本发明实施例中,客户端申请进行写操作或读操作时,所述集群管理节点可以为所述客户端分配用于处理所述读操作或写操作的对应分区,该分区可以归属不同的服务器。
而在分布式存储系统中为了更好的提升数据的可靠性,所述分区中一般可以对应多个服务器,并且在进行写操作过程中,所述客户端需要接收到所述分区中所有服务器发送的执行成功的信息后才确定本次写操作成功。在实际应用中,一个分区中最长设置的可以归属的服务器数量最多为3个。从而可以将数据分别存放在该分区中对应的3个服务器上,以保证数据的可靠性和可用性。
其中,所述分区中对应的服务器的状态主要有OK和UNOK两种类型。若所述服务器可正常工作或正处于正常工作时,则所述服务器的状态为OK;若所述服务器发生故障以及所述服务器处于故障恢复过程中,则所述服务器的状态为UNOK。而所述状态为UNOK的服务器需要在数据恢复完成后,由集群管理节点更新所述服务器的状态为OK。
3)协调节点,为现有技术中用于将客户端发送的IO请求转发给集群服管理节点,然后,用于接收所述集群管理节点分配的服务器ID以及进行所述IO请求的地址分配等操作,并将所述服务器ID以及分配的所述地址通知给所述客户端。
除非有相反的说明,本申请实施例提及“第一”、“第二”、“第三”、“第四”等序数词是用于对多个对象进行区分,不用于限定多个对象的顺序、时序、优先级或者重要程度。
此外,本申请实施例和权利要求书及附图中的术语“包括”和“具有”不是排他的。例如,包括了一系列步骤或模块的过程、方法、系统、产品或设备,不限定于已列出的步骤或模块,还可以包括没有列出的步骤或模块。
通过本申请实施例中上述应用场景的介绍,下面针对所述客户端向所述服务器进行写操作的具体处理过程进行具体介绍。
当客户端需要进行写操作时,直接向集群管理节点发送分配进行写操作的服务器请求。所述集群管理节点收到客户端发送的分配进行写操作的服务器请求后,根据系统负载向所述客户端返回合适的分区信息。其中,所述分区信息中包含分区ID,从而可以使所述客户端根据分区ID与分区中服务器的IP地址的对应关系,确定所述集群管理节点分配的分区信息中分区ID对应的分区中服务器的IP地址。
可选的,所述分布式存储系统中一个分区中仅设置一个服务器时,所述集群管理节点收到客户端发送的分配进行写操作的服务器请求后,根据系统负载可直接向所述客户端返回合适的服务器ID,从而可以使所述客户端根据所述服务器ID确定进行写操作的服务器。
一般情况下,所述分布式存储系统中为保证数据的可靠性和可用性,可以在一个分区中设置多个服务器,则所述客户端进行写操作时,可能会向多个服务器发送写操作,使多个服务器中存储的数据保持一致性。从而在某个服务器发生故障或者数据损坏时,客户端可以通过一个分区下的其它服务器继续执行读操作以及进行数据修复。
例如,假设分区ID与分区中服务器的IP地址的对应关系如下表1所示,向所述集群管理节点发送分配进行写操作的服务器请求的客户端标识为客户端1,所述集群管理节点发送给所述客户端1的分区信息中包含的分区ID为分区1,则通过表1所示内容,可以确定执行所述客户端1写操作的服务器的IP地址分别为34.144.246.240(根据IP地址可确定该服务器为服务器1)、46.150.246.240(根据IP地址可确定该服务器为服务器2)、36.116.246.240(根据IP地址可确定该服务器为服务器3)。
Figure BDA0002098920290000081
表1分区ID与分区中服务器的IP地址的对应关系
因该分区ID对应的服务器为3个,则所述客户端1确定执行写操作的服务器的IP地址为34.144.246.240、46.150.246.240以及36.116.246.240后,就可以向IP地址为34.144.246.240、46.150.246.240以及36.116.246.240的服务器发送写请求,即向服务器1、服务器2以及服务器3发送写请求。
进一步的,本申请实施例中客户端向服务器发送写操作请求,所述服务器根据接收到的写操作请求进行数据写入时,需要确定写入数据的对应位置。其中,所述服务器中存储有客户端标识与存储资源的对应关系。从而所述服务器在接收到所述客户端发送的携带有客户端标识以及待写入的数据的写操作请求后,所述服务器则可以根据客户端标识与存储资源的对应关系,确定接收到的所述写操作请求中携带的所述客户端标识对应的存储资源。然后,所述服务器将所述写操作请求中携带的待写入数据写入对应的存储资源。
例如,假设客户端标识与存储资源的对应关系如下表2所示,向所述服务器发送写操作请求的客户端的标识为客户端1,则通过表2所示内容,可以确定所述客户端1在所述服务器中对应的存储资源为存储资源1。
若所述客户端2也向服务器发送写操作请求,则通过表2所示的内容,可以确定所述客户端2在所述服务器中对应的存储资源为存储资源2和存储资源3。其中,本申请实施例中所执行的写入操作是在原有存储数据的基础上进行的续写操作,则所述服务器可根据所述客户端1上一次写入的结束位置确定执行本次写操作的起始位置。即若所述服务器确定所述客户端2上一次写入的结束位置处于存储资源3中,则所述服务器将所述存储资源3确定为进行本次写操作数据写入的存储资源。
进一步的,本申请实施例进行数据写入时,为避免存储资源浪费的问题,在进行数据写入时,会保证每个进行数据写入的存储资源都尽量写满数据。也就是说,若客户端在服务器中对应多个存储资源,则会在占满一个存储资源后,才开始占用另一个存储资源。
因此,若所述客户端2向服务器发送写操作请求时,所述服务器还可以通过确定所述客户端2对应的存储资源2与存储资源3哪个存储资源未写满数据来确定执行本次写操作的存储资源。假设所述客户端2对应的存储资源2内存已满,存储资源3中还有剩余内存,则所述服务器将所述存储资源3确定为进行本次写操作数据写入的存储资源。
Figure BDA0002098920290000091
表2客户端标识与存储资源的对应关系
进一步的,本申请实施例中还可通过日志的方式确定客户端标识与存储资源的对应关系,例如,以层次型Log(日志)来组织多个写请求写入同一个Log。如所述层次型Log的结构可以为Logical-Log(逻辑日志)+Physical-Log(物理日志)的架构。其中,所述架构中的Logical-Log可以为链式结构,用于管理服务器下多个请求之间的读写关系。所述架构中的Physical-Log用于以日志结构管理某个具体请求的读写。本申请实施例中的所述Physical-Log空间可以采用Thin(薄层)分配。由此,通过层次型Log组织结构,可以更好的对上层多个请求提供透明的、高性能的、互不影响的IO服务,并且在故障场景中可以根据Logical-Log结构,分别进行故障检测和并行恢复,能够极大地提升分布式存储系统的可靠性。
所述服务器将所述写操作请求中携带的待写入数据写入对应的存储资源时,可以有多种存储方式,下面分别进行介绍。
存储方式1:先向确定的存储资源进行数据写入,并在发现所述存储资源已满,无法进行存储时,创建新的存储资源进行数据存储。
具体地,若已将所述存储资源1写满,但是所述待写入数据还未完全存储,则所述服务器为所述客户端再分配一个存储资源。然后,将所述待写入数据中还未进行存储的数据按照数据的顺序存储在新分配的存储资源。若在存储过程中,本次新分配的存储资源写满,但是所述待写入数据还未完全存储,则所述服务器为所述客户端再分配一个存储资源进行数据存储,直到所述待写入数据成功存储为止。在该过程中,所述服务器每创建一个存储资源,都需要记录所述客户端的标识与创建的存储资源的对应关系,并更新所述服务器中保存的客户端标识与存储资源的对应关系。
如图3b所示,假设客户端1在所述服务器中对应的存储资源为存储资源1,所述服务器每次创建的存储资源大小固定,且都为60M。假设所述存储资源1中当前剩余资源为20M,所述待写入数据大小为90M。因此,所述服务器紧跟着上一次写入的结束位置将所述写操作请求中包含的待写入数据按照数据的顺序存储在所述存储资源1中。因所述存储资源1中仅能存储所述待写入数据中的20M数据,所述待写入数据还未完全存储,则所述服务器为所述客户端再分配一个存储资源,例如存储资源6。然后,将所述待写入数据中还未进行存储的数据按照数据的顺序存储在新分配的存储资源。因所述存储资源6中仅能存储所述待写入数据中的60M数据,所述待写入数据还未完全存储,则所述服务器为所述客户端再分配一个存储资源,例如存储资源7。所述服务器将所述待写入数据剩余的10M数据存储在存储资源7中。
存储方式2:客户端向确定的服务器进行数据写入时,先确定进行本次写操作请求对应的存储资源中剩余空间是否足够写入待写入数据。若可以,则直接进行数据写入;若不可以,则创建至少一个存储资源用于进行数据存储。
比如,如图3c所示,假设客户端1在所述服务器中对应的存储资源为存储资源1,所述服务器每次创建的存储资源大小固定,且都为60M。假设所述存储资源1中当前剩余资源为20M,所述待写入数据大小为90M,则所述服务器确定进行本次写操作请求对应的存储资源中剩余空间不足够存储待写入数据。
因此,所述服务器根据所述待写入数据的大小以及所述存储资源1中剩余内存的大小,可确定需要再创建2个新的存储资源,例如存储资源6和存储资源7。其中,本申请实施例中为了提升写操作的速度,所述存储资源1、所述存储资源6以及所述存储资源7可以同步进行数据存储。即将所述待写入数据中前20M大小的数据存储在存储资源1中的剩余空间中,将所述待写入数据中21M至80M的数据存储在存储资源6中,将所述待写入数据剩余的10M数据存储在存储资源7中。
在该过程中,所述服务器创建的新的存储资源,都需要记录所述客户端的标识与创建的存储资源的对应关系,并更新所述服务器中保存的客户端标识与存储资源的对应关系。进一步的,所述服务器将所述待写入数据存储到对应的存储资源后,为方便客户端进行读操作请求,则所述服务器还需创建所述客户端的标识与所述待写入的数据的物理地址之间的对应关系,并将所述客户端的标识与所述待写入的数据的物理地址之间的对应关系发送给所述客户端。由此,所述客户端在向所述服务器进行读操作请求时,可根据所述客户端的标识与所述待写入的数据的物理地址之间的对应关系确定需要读取数据的起始位置。
本申请实施例提供的执行写操作的流程具体可以如图4所示,这里假设每个分区对应3个服务器,具体步骤如下:
S400:客户端1向集群管理节点申请分区信息。
S401:集群管理节点根据系统负载,确定并向客户端1返回合适的分区信息。其中,所述分区信息中包含分区ID。
S402:客户端1根据分区ID与分区路由信息的对应关系,确定接收到的分区信息中的分区ID对应的分区路由信息。
S403:客户端1根据所述分区路由信息,确定与所述分区路由信息对应的3个服务器,并将3个服务器确定为进行写操作的服务器。假设3个服务器分别为服务器1、服务器2和服务器3。
S404:客户端1根据所述分区路由信息向所述分区对应的3个服务器(服务器1、服务器2和服务器3)请求并发执行写操作。
S405:服务器1、服务器2和服务器3的任意一个判断是否是第一次执行客户端1发送的写操作,若是,则为客户端1分配第一存储资源,并保存所述客户端1的标识与所述存储资源的标识的对应关系;若否,则根据存储资源的标识与客户端的标识的对应关系,确定已为所述客户端分配的第一存储资源。
S406:所述服务器判断所述第一存储资源中剩余的存储空间大小是否小于待写入数据的大小,若是,则为客户端1继续分配至少一个第二存储资源,并记录所述客户端的标识与所述至少一个第二存储资源的标识的对应关系。其中,所述待写入数据的大小是根据所述写操作请求中的信息进行确定的。
S407:所述服务器将所述待写入的数据存储到所述第一存储资源中,并创建客户端1的标识与所述待写入的数据的物理地址之间的对应关系。
其中,若所述第一存储资源中剩余的存储空间大小小于待写入数据的大小,且服务器已为客户端1分配了至少一个第二存储资源,则服务器将所述待写入的数据中的一部分数据存储到所述第一存储资源中,并将所述待写入的数据中的剩余部分数据存储到所述第二存储资源中。
S408:服务器完成数据存储后向客户端1返回执行结果。其中,所述执行结果中还包含客户端1的标识与所述待写入的数据的物理地址之间的对应关系。
S409:客户端1接收服务器返回的执行结果,若在预定时长内接收到所述分区内的3个服务器返回的执行结果,且所述执行结果都为成功,则确定此次写操作成功。
进一步的,在客户端1向所述分区中的3个服务器发送写请求的同时,如果有另一个客户端2也需要向所述分区中的3个服务器发送写请求,则可按照上述步骤同步进行操作。
可选的,若数据写入过程发生故障,则对故障恢复处理方式可如图5所示。
其中,假设故障场景为服务器3发生故障。因为故障场景下数据写入的过程只会发生在数据写入阶段,则当客户端1下发写操作请求时,若未收到服务器3的响应,会进行一定次数的重试操作(假定重试5次,每次间隔1s)。
当超过预定重试次数,客户端1仍然未能收到服务器3的响应,则客户端1就可以确定本次数据写入失败(具体参照步骤1、步骤2和步骤3)。
此时,集群管理节点更新本次写操作所涉及的分区状态以及所述分区对应的服务器状态。即该分区下的服务器当前不能继续承接写操作业务,需要等待服务器3走故障恢复流程(具体参照步骤4)。
故障的服务器3从故障状态恢复至正常工作状态后,会向当前分区下的服务器1和服务器2发起故障恢复任务(具体参照步骤5)。此时,分区下的主服务器1向分区下的所有状态OK的服务器发起获取元数据的请求。其中,所述分区下的主服务器(服务器1和服务器2和服务器3)协商出最小的data_length,并确定最小的data_length对应的数据。
根据协商出的最小data_length,所述分区下的主服务器1将最小的data_length对应的数据写入所述分区下的其他服务器2和服务器3中(具体参照步骤6、步骤7和步骤8)。
当所述分区中的服务器1收到所述分区中其他所有服务器2和服务器3返回的写入成功信息后,则确定故障恢复任务完成,由集群管理节点更新所述分区内的服务器状态信息(具体参照步骤9)。
下面再进而针对所述客户端向所述服务器进行读操作的具体实现过程进行具体介绍。
当客户端需要进行读操作时,可以向集群管理节点发送分配进行读操作的服务器请求。其中,所述分配进行读操作的服务器请求中包含所述要读取的数据的物理地址,收到客户端发送的分配进行读操作的服务器请求后,所述集群管理节点根据所述分配进行读操作的服务器请求中包含的物理地址确定进行处理所述读请求的分区,然后向所述客户端返回合适的分区信息。
其中,所述分区信息中包含分区ID,从而可以使所述客户端根据分区ID与分区中服务器的IP地址的对应关系,确定所述集群管理节点分配的分区信息中分区ID对应的分区中服务器的IP地址。
例如,假设分区ID与分区中服务器的IP地址的对应关系如上表1所示,向所述集群管理节点发送分配进行写操作的服务器请求的客户端的标识为客户端1,所述集群管理节点发送给所述客户端1的分区信息中包含的分区ID为分区1,则通过表1所示内容,可以确定所述分区1中对应的服务器的IP地址分别为34.144.246.240(根据IP地址可确定该服务器为服务器1)、46.150.246.240(根据IP地址可确定该服务器为服务器2)、36.116.246.240(根据IP地址可确定该服务器为服务器3)。因为同一路由信息下的服务器中所存储的数据具有一致性,则所述客户端1仅需从服务器1,服务器2以及服务器3中随机选取一个服务器确定为执行读操作的服务器,并向选取的服务器发送读操作请求。其中,所述读请求中包含所述客户端标识、需要读取数据的起始位置及长度等信息。
可选的,所述分布式存储系统中一个分区中仅设置一个服务器时,所述集群管理节点收到客户端发送的分配进行读操作的服务器请求后,可直接向所述客户端返回对应的分区中的服务器ID,从而可以使所述客户端根据所述服务器ID确定进行读操作的服务器。
进一步的,本申请实施例中客户端向服务器发送读操作请求,所述服务器可以根据接收到的读操作请求进行数据读取时,需要确定读取的数据。
具体地,所述服务器在接收到所述客户端发送的携带有客户端标识以及需要读取数据的起始位置及长度后,所述服务器从对应的存储资源中确定需要读取的数据的情况可以有多种,下面分别进行介绍。
读取情况1:若所述服务器根据所述读操作请求中的起始位置及长度确定所述需要读取的数据在同一存储资源中,则所述服务器在对应的存储资源中确定需要读取的数据,并将确定的需要读取的数据发送给所述客户端。
比如,如图6a所示,假设客户端1发送给所述服务器的读操作请求中包含的需要读取数据的起始位置为第65M,需要读取的长度为20M,所述服务器中的每个存储资源大小都为60M,且所述客户端1对应的存储资源存储数据的顺序依次是存储资源1、存储资源6、存储资源7。
因此,所述服务器根据需要读取数据的起始位置65M可以确定所述需要读取数据的起始位置在所述存储资源6中。所述服务器再根据所述需要读取的长度20M可以确定所述需要读取数据的结束位置也在所述存储资源6中,则如图6a所示,所述服务器将所述存储资源6中对应的需要读取的数据发送给所述客户端1。
读取情况2:若所述服务器根据所述读操作请求中的起始位置及长度确定所述需要读取的数据在多个存储资源中,则所述服务器分别从对应的多个存储资源中确定需要读取的数据,并将从多个存储资源中读取的数据按照数据的顺序整合后发送给所述客户端。
比如,如图6b所示,假设客户端1发送给所述服务器的读操作请求中包含的需要读取数据的起始位置为第41M,需要读取的长度为130M,所述服务器中的每个存储资源大小都为60M,且所述客户端1对应的存储资源存储数据的顺序依次是存储资源1、存储资源6、存储资源7。
因此,所述服务器根据需要读取数据的起始位置41M可以确定所述需要读取数据的起始位置在所述存储资源1中。所述服务器再根据所述需要读取的长度130M可以确定所述需要读取数据的结束位置在所述存储资源7中,则如图6b所示,所述需要读取的数据部分存储在存储资源1中,部分存储在存储资源6中,还有部分存储在存储资源7中。故所述服务器将所述存储资源1中对应的需要读取的数据与所述存储资源6中对应的需要读取的数据以及存储资源7中需要读取的数据按照顺序整合,并发送给所述客户端1。
本申请实施例提供的执行读操作的流程可以如图7所示,这里假设每个分区中对应3个服务器,具体步骤如下。
S700:客户端1根据客户端的标识与写入服务器的数据的物理地址之间的对应关系,确定读取数据所在服务器的分区信息。
其中,所述分区信息中包含分区ID。
S701:客户端1根据分区ID与分区路由信息的对应关系,确定分区信息中的分区ID对应的分区路由信息。
S702:客户端1根据所述分区路由信息,确定与所述分区路由信息对应的3个服务器,并从3个服务器中随机选取一个服务器确定为进行读操作的服务器。
其中,假设3个服务器分别为服务器1、服务器2和服务器3。
S703:客户端1向确定进行读操作的服务器发送读请求,其中所述读请求中包含所述客户端标识、需要读取数据的起始位置及长度等信息。
S704:服务器接收所述客户端的发送的读请求,根据所述读请求确定所述读请求对应的数据。
S705:服务器将所述数据发送给所述客户端。
S706:客户端1读取服务器发送的数据。
进一步的,在客户端1从所述分区中的3个服务器中随机选取一个服务器进行读操作的同时,如果有另一个客户端2也需要从所述分区中的3个服务器中随机选取一个服务器进行读操作,则可按照上述步骤同步进行操作。
进一步的,若在数据读取过程发送故障,则本申请实施例也提出以下三种情况进行故障修复处理,以保证数据读取过程正常进行:
情况1:所述分区内没有故障恢复任务正在执行。这种情况下,故障的服务器还没有启动恢复流程。
此时,所述读请求会触发所述分区内的主服务器进行一次数据的协商过程(即与上述写操作过程中出现故障的处理流程中协商出最小的data_length相同,具体操作参照图5中的步骤5-步骤7)。协商结束后,则所述读请求对应的存储资源转变为只读状态,则可以满足前台的读请求。
情况2:所述分区内有故障恢复任务正在执行。这种情况下若收到客户端发送的读请求,所述服务器会先向上层返回BUSY指令,此时,需要等待故障恢复任务完成之后再响应读请求。
情况3:所述分区内故障恢复任务已经完成,故障的服务器状态变为OK。这种情况下则可以正常响应客户端发送的读请求。
通过上述对本申请方案的介绍,可以理解的是,上述实现各设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本发明能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
如图8所示,本发明实施例一种执行写操作的服务器,该服务器至少包括处理器800和存储器801。所述存储器801中存储有程序802。处理器800、存储器801和通信接口之间通过系统总线连接并完成相互间的通信。
处理器800是单核或多核中央处理单元,或者为特定集成电路,或者为被配置成实施本发明实施例的一个或多个集成电路。存储器801可以为高速RAM存储器,也可以为非易失性存储器(non-volatile memory),例如至少一个硬盘存储器。存储器801用于存储计算机执行指令。具体的,计算机执行指令中可以包括程序802。当所述服务器运行时,处理器800运行所述程序802以执行图4所示的S405-S408的方法流程。
如图9所示,本发明提供一种执行写操作的服务器,该服务器包括:
接收模块900:用于接收第一客户端发送的第一写请求,所述第一写请求中包含所述第一客户端的标识和第一待写入的数据;接收第二客户端发送的第二写请求,所述第二写请求包含所述第二客户端的标识和第二待写入的数据;
处理模块901:用于根据所述第一客户端的标识以及保存的客户端的标识与分配的存储资源之间的对应关系,确定为所述第一客户端分配的存储资源是第一存储资源;根据所述第二客户端的标识以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述第二客户端分配的存储资源是第二存储资源,其中所述第二存储资源所位于的物理地址不同于所述第一存储资源所位于的物理地址;将所述第一待写入的数据存储到所述第一存储资源中,并且将所述第二待写入的数据存储到所述第二存储资源中;
创建模块902:创建所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系,以及所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系。
上述图9所示的接收模块900、处理模块901以及创建模块902的功能可以由处理器800运行程序802执行,或者由处理器800单独执行。
基于同一发明构思,本发明实施例中还提供了一种执行写操作的方法,由于该方法对应是本发明实施例中所介绍的用于执行写操作的服务器,并且该方法解决问题的原理与该服务器相似,因此该方法的实施可以参见本发明实施例中服务器的实施,重复之处不再赘述。
如图10所示,本发明实施例还提供一种执行写操作的方法,该方法包括:
步骤1000、服务器接收第一客户端发送的第一写请求,所述第一写请求包含所述第一客户端的标识和第一待写入的数据;
步骤1001、所述服务器接收第二客户端发送的第二写请求,所述第二写请求包含所述第二客户端的标识和第二待写入的数据;
步骤1002、所述服务器根据所述第一客户端的标识以及保存的客户端的标识与分配的存储资源之间的对应关系,确定为所述第一客户端分配的存储资源是第一存储资源;
步骤1003、所述服务器根据所述第二客户端的标识以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述第二客户端分配的存储资源是第二存储资源,其中所述第二存储资源所位于的物理地址不同于所述第一存储资源所位于的物理地址;
步骤1004、所述服务器将所述第一待写入的数据存储到所述第一存储资源中,并且将所述第二待写入的数据存储到所述第二存储资源中;
步骤1005、所述服务器创建所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系,以及所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系。
如图11所示,本发明实施例一种执行读操作的服务器,该服务器至少包括处理器1100和存储器1101。所述存储器1101中存储有程序1102。处理器1100、存储器1101和通信接口之间通过系统总线连接并完成相互间的通信。
处理器1100是单核或多核中央处理单元,或者为特定集成电路,或者为被配置成实施本发明实施例的一个或多个集成电路。存储器1101可以为高速RAM存储器,也可以为非易失性存储器(non-volatile memory),例如至少一个硬盘存储器。存储器1101用于存储计算机执行指令。具体的,计算机执行指令中可以包括程序1102。当所述服务器运行时,处理器1100运行所述程序1102以执行图7所示的S704-S706的方法流程。
如图12所示,一种执行读操作的服务器,该服务器包括:
接收模块1200:用于接收第一客户端的发送的第一读请求,所述第一读请求中包含所述第一客户端的标识、第一待读取的数据的起始位置及长度;接收所述第二客户端发送的第二读请求,所述第二读请求中包含所述第二客户端的标识、第二待读取的数据的起始位置及长度;
处理模块1201:用于根据所述第一读请求确定所述第一待读取的数据,并将所述第一待读取的数据发送给所述第一客户端,以及根据所述第二读请求确定所述第二待读取的数据,并将所述第二待读取的数据发送给所述第二客户端。
上述图12所示的接收模块1200和处理模块1201的功能可以由处理器1100运行程序1102执行,或者由处理器1100单独执行。
基于同一发明构思,本发明实施例中还提供了一种执行读操作的方法,由于该方法对应是本发明实施例中所介绍的用于执行读操作的服务器,并且该方法解决问题的原理与该服务器相似,因此该方法的实施可以参见本发明实施例中服务器的实施,重复之处不再赘述。
如图13所示,本发明实施例还提供一种执行读操作的方法,该方法包括:
步骤1300、服务器接收第一客户端发送的第一读请求,所述第一读请求中包含所述第一客户端的标识、第一待读取的数据的起始位置及长度;
步骤1301、所述服务器接收所述第二客户端发送的第二读请求,所述第二读请求中包含所述第二客户端的标识、第二待读取的数据的起始位置及长度;
步骤1302、所述服务器根据所述第一读请求确定所述第一待读取的数据,并将所述第一待读取的数据发送给所述第一客户端,以及根据所述第二读请求确定所述第二待读取的数据,并将所述第二待读取的数据发送给所述第二客户端。
在一些可能的实施方式中,本发明实施例提供的执行写操作、读操作的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序代码在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书中描述的根据本发明各种示例性实施方式的执行写操作、读操作的方法中的步骤。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
根据本发明的实施方式的用于执行写操作、读操作的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在服务器设备上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被信息传输、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由周期网络动作系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等,或者上述的任意合适的组合。
可以用一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备。
本申请实施例针对执行写操作的方法还提供一种计算设备可读存储介质,即断电后内容不丢失。该存储介质中存储软件程序,包括程序代码,当所述程序代码在计算设备上运行时,该软件程序在被一个或多个处理器读取并执行时可实现本申请实施例上面任何一种执行写操作的方案。
本申请实施例针对执行读操作的方法还提供一种计算设备可读存储介质,即断电后内容不丢失。该存储介质中存储软件程序,包括程序代码,当所述程序代码在计算设备上运行时,该软件程序在被一个或多个处理器读取并执行时可实现本申请实施例上面任何一种执行读操作的方案。
以上参照示出根据本申请实施例的方法、装置(系统)和/或计算机程序产品的框图和/或流程图描述本申请。应理解,可以通过计算机程序指令来实现框图和/或流程图示图的一个块以及框图和/或流程图示图的块的组合。可以将这些计算机程序指令提供给通用计算机、专用计算机的处理器和/或其它可编程数据处理装置,以产生机器,使得经由计算机处理器和/或其它可编程数据处理装置执行的指令创建用于实现框图和/或流程图块中所指定的功能/动作的方法。
相应地,还可以用硬件和/或软件(包括固件、驻留软件、微码等)来实施本申请。更进一步地,本申请可以采取计算机可使用或计算机可读存储介质上的计算机程序产品的形式,其具有在介质中实现的计算机可使用或计算机可读程序代码,以由指令执行系统来使用或结合指令执行系统而使用。在本申请上下文中,计算机可使用或计算机可读介质可以是任意介质,其可以包含、存储、通信、传输、或传送程序,以由指令执行系统、装置或设备使用,或结合指令执行系统、装置或设备使用。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包括这些改动和变型在内。

Claims (17)

1.一种执行写操作的方法,其特征在于,包括:
服务器接收第一客户端发送的第一写请求,所述第一写请求包含所述第一客户端的标识和第一待写入的数据;
所述服务器接收第二客户端发送的第二写请求,所述第二写请求包含所述第二客户端的标识和第二待写入的数据;
所述服务器根据所述第一客户端的标识以及保存的客户端的标识与分配的存储资源之间的对应关系,确定为所述第一客户端分配的存储资源是第一存储资源;
所述服务器根据所述第二客户端的标识以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述第二客户端分配的存储资源是第二存储资源,其中所述第二存储资源所位于的物理地址不同于所述第一存储资源所位于的物理地址;
所述服务器将所述第一待写入的数据存储到所述第一存储资源中,并且将所述第二待写入的数据存储到所述第二存储资源中;
所述服务器创建所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系,以及所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系。
2.如权利要求1所述的方法,其特征在于,所述服务器创建所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系,以及所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系之后,还包括:
所述服务器将所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系发送给所述第一客户端,以及将所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系发送给所述第二客户端。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
所述服务器接收所述第一客户端发送的第一读请求,所述第一读请求中包含所述第一客户端的标识、第一待读取的数据的起始位置及长度;
所述服务器接收所述第二客户端发送的第二读请求,所述第二读请求中包含所述第二客户端的标识、第二待读取的数据的起始位置及长度;
所述服务器根据所述第一读请求确定所述第一待读取的数据,并将所述第一待读取的数据发送给所述第一客户端,以及根据所述第二读请求确定所述第二待读取的数据,并将所述第二待读取的数据发送给所述第二客户端。
4.如权利要求1所述的方法,其特征在于,所述服务器将所述第一待写入的数据存储到所述第一存储资源中,并且将所述第二待写入的数据存储到所述第二存储资源中之前,还包括:
所述服务器若确定所述第一存储资源中剩余的存储空间大小小于所述第一待写入的数据的大小时,为所述第一客户端继续分配至少一个第三存储资源,并记录所述第一客户端的标识与所述至少一个第三存储资源的标识的对应关系;
所述服务器若确定所述第二存储资源中剩余的存储空间大小小于所述第二待写入的数据的大小时,为所述第二客户端继续分配至少一个第四存储资源,并记录所述第二客户端的标识与所述至少一个第四存储资源的标识的对应关系;
所述服务器将所述第一待写入的数据存储到所述第一存储资源中,并且将所述第二待写入的数据存储到所述第二存储资源中包括:
所述服务器将所述第一待写入的数据中的部分数据存储到所述第一存储资源中,并将所述第一待写入的数据中的剩余部分数据存储到所述第三存储资源中;
所述服务器将所述第二待写入的数据中的部分数据存储到所述第二存储资源中,并将所述第二待写入的数据中的剩余部分数据存储到所述第四存储资源中。
5.一种执行读操作的方法,其特征在于,包括:
服务器接收第一客户端发送的第一读请求,所述第一读请求中包含所述第一客户端的标识、第一待读取的数据的起始位置及长度;
所述服务器接收所述第二客户端发送的第二读请求,所述第二读请求中包含所述第二客户端的标识、第二待读取的数据的起始位置及长度;
所述服务器根据所述第一读请求确定所述第一待读取的数据,并将所述第一待读取的数据发送给所述第一客户端,以及根据所述第二读请求确定所述第二待读取的数据,并将所述第二待读取的数据发送给所述第二客户端。
6.如权利要求5所述的方法,其特征在于,所述服务器根据所述第一读请求确定所述第一待读取的数据,以及根据所述第二读请求确定所述第二待读取的数据,包括:
所述服务器根据所述第一客户端的标识,确定为所述第一客户端分配的存储资源是第一存储资源;所述服务器根据所述第二客户端的标识,确定为所述第二客户端分配的存储资源是第二存储资源;
所述服务器根据所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系以及所述第一待读取的数据的起始位置及长度,从所述第一存储资源中确定所述第一待读取的数据;
所述服务器根据所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系以及所述第二待读取的数据的起始位置及长度,从所述第二存储资源中确定所述第二待读取的数据。
7.如权利要求6所述的方法,其特征在于,所述服务器根据所述第一客户端的标识,确定为所述第一客户端分配的第一存储资源以及根据所述第二客户端的标识,确定为所述第二客户端分配的第二存储资源,包括:
所述服务器根据所述第一客户端的标识,以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述第一客户端分配的存储资源是所述第一存储资源;
所述服务器根据所述第二客户端的标识,以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述第二客户端分配的存储资源是所述第二存储资源。
8.一种服务器,其特征在于,包括:处理单元和通信单元;
所述通信单元,用于接收第一客户端发送的第一写请求,所述第一写请求中包含所述第一客户端的标识和第一待写入的数据;接收第二客户端发送的第二写请求,所述第二写请求包含所述第二客户端的标识和第二待写入的数据;
所述处理单元,用于根据所述第一客户端的标识以及保存的客户端的标识与分配的存储资源之间的对应关系,确定为所述第一客户端分配的存储资源是第一存储资源;根据所述第二客户端的标识以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述第二客户端分配的存储资源是第二存储资源,其中所述第二存储资源所位于的物理地址不同于所述第一存储资源所位于的物理地址;将所述第一待写入的数据存储到所述第一存储资源中,并且将所述第二待写入的数据存储到所述第二存储资源中;创建所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系,以及所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系。
9.如权利要求8所述的服务器,其特征在于,所述通信单元,还用于:
将所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系发送给所述第一客户端,以及将所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系发送给所述第二客户端。
10.如权利要求9所述的服务器,其特征在于,所述通信单元,还用于:
接收所述第一客户端的发送的第一读请求,所述第一读请求中包含所述第一客户端的标识、第一待读取的数据的起始位置及长度;接收所述第二客户端发送的第二读请求,所述第二读请求中包含所述第二客户端的标识、第二待读取的数据的起始位置及长度;
所述处理单元,还用于根据所述第一读请求确定所述第一待读取的数据,并将所述第一待读取的数据发送给所述第一客户端,以及根据所述第二读请求确定所述第二待读取的数据,并将所述第二待读取的数据发送给所述第二客户端。
11.如权利要求8所述的服务器,其特征在于,所述处理单元还用于:
若确定所述第一存储资源中剩余的存储空间大小小于所述第一待写入的数据的大小时,为所述第一客户端继续分配至少一个第三存储资源,并记录所述第一客户端的标识与所述至少一个第三存储资源的标识的对应关系;
若确定所述第二存储资源中剩余的存储空间大小小于所述第二待写入的数据的大小时,为所述第二客户端继续分配至少一个第四存储资源,并记录所述第二客户端的标识与所述至少一个第四存储资源的标识的对应关系;
所述处理单元在将所述第一待写入的数据存储到所述第一存储资源中,并且将所述第二待写入的数据存储到所述第二存储资源中时,具体用于:
将所述第一待写入的数据中的部分数据存储到所述第一存储资源中,并将所述第一待写入的数据中的剩余部分数据存储到所述第三存储资源中;
将所述第二待写入的数据中的部分数据存储到所述第二存储资源中,并将所述第二待写入的数据中的剩余部分数据存储到所述第四存储资源中。
12.一种服务器,其特征在于,包括:处理单元和通信单元;
所述通信单元,用于接收第一客户端的发送的第一读请求,所述第一读请求中包含所述第一客户端的标识、第一待读取的数据的起始位置及长度;接收所述第二客户端发送的第二读请求,所述第二读请求中包含所述第二客户端的标识、第二待读取的数据的起始位置及长度;
所述处理单元,用于根据所述第一读请求确定所述第一待读取的数据,并将所述第一待读取的数据发送给所述第一客户端,以及根据所述第二读请求确定所述第二待读取的数据,并将所述第二待读取的数据发送给所述第二客户端。
13.如权利要求12所述的服务器,其特征在于,所述处理单元具体用于:
根据所述第一客户端的标识,确定为所述第一客户端分配的存储资源是第一存储资源;根据所述第二客户端的标识,确定为所述第二客户端分配的存储资源是第二存储资源;
根据所述第一客户端的标识与所述第一存储资源所位于的物理地址之间的对应关系以及所述第一待读取的数据的起始位置及长度,从所述第一存储资源中确定所述第一待读取的数据;
根据所述第二客户端的标识与所述第二存储资源所位于的物理地址之间的对应关系以及所述第二待读取的数据的起始位置及长度,从所述第二存储资源中确定所述第二待读取的数据。
14.如权利要求13所述的服务器,其特征在于,所述处理单元具体用于:
根据所述第一客户端的标识,以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述第一客户端分配的存储资源是所述第一存储资源;
根据所述第二客户端的标识,以及保存的所述客户端的标识与分配的存储资源之间的对应关系,确定为所述第二客户端分配的存储资源是所述第二存储资源。
15.一种分布式存储系统,其特征在于,包括如权利要求8~11任一项所述的执行写操作的服务器,和如权利要求12~14任一项所述的执行读操作的服务器。
16.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7中任一项所述的方法。
17.一种计算机程序产品,其特征在于,包含有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7中任一项所述的方法。
CN201910528337.2A 2019-06-18 2019-06-18 一种执行写操作、读操作的方法及装置 Active CN112099728B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910528337.2A CN112099728B (zh) 2019-06-18 2019-06-18 一种执行写操作、读操作的方法及装置
PCT/CN2020/088787 WO2020253407A1 (zh) 2019-06-18 2020-05-06 一种执行写操作、读操作的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910528337.2A CN112099728B (zh) 2019-06-18 2019-06-18 一种执行写操作、读操作的方法及装置

Publications (2)

Publication Number Publication Date
CN112099728A true CN112099728A (zh) 2020-12-18
CN112099728B CN112099728B (zh) 2022-09-16

Family

ID=73748430

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910528337.2A Active CN112099728B (zh) 2019-06-18 2019-06-18 一种执行写操作、读操作的方法及装置

Country Status (2)

Country Link
CN (1) CN112099728B (zh)
WO (1) WO2020253407A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114448781A (zh) * 2021-12-22 2022-05-06 天翼云科技有限公司 一种数据处理系统
WO2022262345A1 (zh) * 2021-06-18 2022-12-22 华为技术有限公司 一种数据管理方法、存储空间管理方法及装置
CN114448781B (zh) * 2021-12-22 2024-06-07 天翼云科技有限公司 一种数据处理系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101291205A (zh) * 2008-06-16 2008-10-22 杭州华三通信技术有限公司 传输备份数据的方法、系统、镜像服务器和客户端
US20100100439A1 (en) * 2008-06-12 2010-04-22 Dawn Jutla Multi-platform system apparatus for interoperable, multimedia-accessible and convertible structured and unstructured wikis, wiki user networks, and other user-generated content repositories
CN102035865A (zh) * 2009-09-30 2011-04-27 阿里巴巴集团控股有限公司 数据存储及数据寻址方法、系统和设备
CN102882983A (zh) * 2012-10-22 2013-01-16 南京云创存储科技有限公司 一种云存储系统中提升并发访问性能的数据快速存储方法
CN103873504A (zh) * 2012-12-12 2014-06-18 鸿富锦精密工业(深圳)有限公司 数据分块存储至分布式服务器的系统及方法
US20140189128A1 (en) * 2012-12-31 2014-07-03 Huawei Technologies Co., Ltd. Cluster system with calculation and storage converged
CN107426321A (zh) * 2017-07-31 2017-12-01 郑州云海信息技术有限公司 一种分布式存储系统配额分配方法及装置
CN107632791A (zh) * 2017-10-10 2018-01-26 郑州云海信息技术有限公司 一种存储空间的分配方法及系统
CN107888657A (zh) * 2017-10-11 2018-04-06 上海交通大学 低延迟分布式存储系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104994135B (zh) * 2015-05-25 2018-09-21 华为技术有限公司 存储系统中融合san及nas存储架构的方法及装置
CN107948233B (zh) * 2016-10-13 2021-01-08 华为技术有限公司 处理写请求或读请求的方法、交换机、控制节点

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100100439A1 (en) * 2008-06-12 2010-04-22 Dawn Jutla Multi-platform system apparatus for interoperable, multimedia-accessible and convertible structured and unstructured wikis, wiki user networks, and other user-generated content repositories
CN101291205A (zh) * 2008-06-16 2008-10-22 杭州华三通信技术有限公司 传输备份数据的方法、系统、镜像服务器和客户端
CN102035865A (zh) * 2009-09-30 2011-04-27 阿里巴巴集团控股有限公司 数据存储及数据寻址方法、系统和设备
CN102882983A (zh) * 2012-10-22 2013-01-16 南京云创存储科技有限公司 一种云存储系统中提升并发访问性能的数据快速存储方法
CN103873504A (zh) * 2012-12-12 2014-06-18 鸿富锦精密工业(深圳)有限公司 数据分块存储至分布式服务器的系统及方法
US20140189128A1 (en) * 2012-12-31 2014-07-03 Huawei Technologies Co., Ltd. Cluster system with calculation and storage converged
CN107426321A (zh) * 2017-07-31 2017-12-01 郑州云海信息技术有限公司 一种分布式存储系统配额分配方法及装置
CN107632791A (zh) * 2017-10-10 2018-01-26 郑州云海信息技术有限公司 一种存储空间的分配方法及系统
CN107888657A (zh) * 2017-10-11 2018-04-06 上海交通大学 低延迟分布式存储系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ING-RAY CHEN; NGOC ANH PHAN; I-LING YEN: "Algorithms for supporting disconnected write operations for wireless Web access in mobile client-server environments", 《IEEE TRANSACTIONS ON MOBILE COMPUTING》 *
程斌等: "一种自适应的分布式调度策略", 《小型微型计算机系统》 *
黄华等: "蓝鲸分布式文件系统的客户端元数据缓存模型", 《计算机科学》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022262345A1 (zh) * 2021-06-18 2022-12-22 华为技术有限公司 一种数据管理方法、存储空间管理方法及装置
CN114448781A (zh) * 2021-12-22 2022-05-06 天翼云科技有限公司 一种数据处理系统
CN114448781B (zh) * 2021-12-22 2024-06-07 天翼云科技有限公司 一种数据处理系统

Also Published As

Publication number Publication date
WO2020253407A1 (zh) 2020-12-24
CN112099728B (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
US10528527B2 (en) File management in thin provisioning storage environments
CN108647104B (zh) 请求处理方法、服务器及计算机可读存储介质
US9917884B2 (en) File transmission method, apparatus, and distributed cluster file system
JP7467593B2 (ja) リソース割振り方法、記憶デバイス、および記憶システム
US10084860B2 (en) Distributed file system using torus network and method for configuring and operating distributed file system using torus network
US8832215B2 (en) Load-balancing in replication engine of directory server
CN111338779B (zh) 资源分配方法、装置、计算机设备和存储介质
CN106936931B (zh) 分布式锁的实现方法、相关设备及系统
CN112286688A (zh) 一种内存管理和使用方法、装置、设备和介质
CN105739930A (zh) 一种存储架构及其初始化方法和数据存储方法及管理装置
JP6617461B2 (ja) 制御装置、制御プログラム、及び制御方法
CN112099728B (zh) 一种执行写操作、读操作的方法及装置
US11144207B2 (en) Accelerating memory compression of a physically scattered buffer
CN116954816A (zh) 容器集群控制方法、装置、设备及计算机存储介质
US10846094B2 (en) Method and system for managing data access in storage system
CN109478151B (zh) 网络可访问数据卷修改
CN114090249A (zh) 资源分配方法、装置、电子设备及存储介质
US10726046B2 (en) Object storage system with ordered parallel replication
CN114281516A (zh) 一种基于numa属性的资源分配方法及装置
CN112559164A (zh) 一种资源共享方法及装置
US11960417B2 (en) Input/output queue hinting for resource utilization
US20240160487A1 (en) Flexible gpu resource scheduling method in large-scale container operation environment
CN117950825A (zh) 一种作业调度方法、服务器及服务器集群
KR20240071830A (ko) 소프트웨어 모듈화를 통한 컴퓨팅 자원 관리 시스템 및 방법
CN114500628A (zh) 一种连接选择方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant