WO2018108158A1

WO2018108158A1 - 一种基于多数派的数据存储方法、装置、存储介质及设备

Info

Publication number: WO2018108158A1
Application number: PCT/CN2017/116513
Authority: WO
Inventors: 吴义谱; 张炎泼
Original assignee: 贵州白山云科技有限公司
Priority date: 2016-12-16
Filing date: 2017-12-15
Publication date: 2018-06-21
Also published as: CN108206839B; CN108206839A

Abstract

本文公开了一种基于多数派的数据存储方法、装置、存储介质及设备，在该方法中，前端服务器可根据接收到的文件上传请求从第一预设值个数的文件组中选取一个文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上，在确定文件中的数据上传完成，并接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，则数据写入成功，再将文件中的元数据信息更新至数据库，此时，返回文件上传请求成功。本文通过采用多数派成功方法写入文件，不会出现单点问题，且任意少数派的副本设备出现故障都不会造成数据丢失，另外服务器采用流式代理，将文件内容传输到各副本上，可减少磁盘IO占用。

Description

一种基于多数派的数据存储方法、装置、存储介质及设备

本申请要求在2016年12月16日提交中国专利局、申请号为201611168618.4、发明名称为“一种基于多数派数据存储方法、装置及系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明实施例涉及但不限于数据存储技术领域，尤其涉及一种基于多数派的数据存储方法、装置、存储介质及设备。

背景技术

在大规模分布式存储系统中，设备的宕机、网络的异常和磁盘的故障随处可见，为解决这些异常情况，分布式存储系统往往会将数据冗余存储多份，每一份数据称为一个副本。这样当某个设备出现故障时，可以从其他的设备上访问到数据。同时当某个副本的数据丢失时，可以从其他副本恢复，保证了数据的可靠性。

由于写入数据时，需要写多副本，因此就需要一种方法如何写多个副本才算一次成功的请求。现有写入多副本的方法有：

1、暂存和异步分发方法在接收处理客户端请求的设备上，将上传文件的全部内容接收并临时存储

在该设备的磁盘，并更新对应的文件元数据信息，最后返回一个成功响应。与此同时，调度进程异步的将磁盘的临时文件分发写入多个存储设备，每一个存储设备上的数据作为该文件的一个副本，多个副本都同时写入成功后，再删除前端设备上的临时存储文件，若一次分发写入失败采用循环重试机制。这种方式的特点是，对于最近上传文件的访问采用N+1方式，N为文件副本数，这种机制避免了在未分发写入完成之前，不能访问的问题。

2、写一主和多从方法一个分布式系统集群中，文件被存储在一个分片中，系统中预先分配一定数量的分片，分片采用多副本的方式，分片的多个副本被存储在不同的存储机器上，多个副本采用某种算法(如paxos算法)选举出一个主，当原来的主宕机或者失联时，选举算法再选择一个主，主负责分片的写入操作。这种方式的特点是，对于一个文件的写入请求，按照一定的策略(如hash策略)将文件写入到某个分片上，写操作必须先写主分片，然后由主分片去写多个从分片，当大于或等于N/2个从分片写成功后，再由主分片返回成功响应，N为从分数。

对于上述现有数据写入方式存在以下问题：

1、文件暂存在设备磁盘上，会出现单点问题，当文件还未分发到存储设备之前，若该设备宕机或者存储文件的磁盘出现故障，将会导致文件永久的丢失；2、暂存接收文件写磁盘再异步分发，将导致暂存机器磁盘IO增大，当负载高时，将严重影响该设备的性能；

3、写主和多从方法，需要维护分片之间的主从关系，当主异常时，还未选举新的主之前，所有映射到该分片的写入操作都将失败。

因此，亟需提供一种防止文件丢失、提高数据写入成功率且不会出现单点问题以及减少磁盘IO占用的数据存储方法。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本发明实施例提供了一种基于多数派的数据存储方法、装置、存储介质及设备，用以实现防止文件丢失、提高数据写入成功率且不会出现单点问题以及减少磁盘IO占用的效果。

本发明实施例提供的基于多数派的数据存储方法，包括：

前端服务器接收文件上传请求，根据所述文件上传请求从第一预设值个数的文件组中选取一个文件组；

接收文件中的数据，根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上；

当确定文件中的数据上传完成且接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，确定数据写入成功，将文件中的元数据信息更新至数据库，；

其中，所述第一预设值、所述第二预设值和所述第三预设值均为大于1的正整数，且所述第三预设值小于或等于所述第二预设值。

上述方法还具有以下特点：

每一文件组中分别存储有各存储单元对应的地址；

所述将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上之前，所述方法还包括：

根据选取出的文件组中存储的各存储单元对应的地址，同时与选取出的文件组中的每一存储单元建立HTTP连接。

上述方法还具有以下特点：

所述接收文件中的数据，根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上，包括：

接收文件中的数据，每当接收到的文件中的数据的容量达到预设阈值时，根据选取出的文件组，将接收到的文件中的数据分别通过HTTP连接并行上传至选取出的文件组对应的第二预设值个数的存储单元上。

上述方法还具有以下特点：

所述方法还包括：检测每个存储单元的传输速度，并选取出传输速度最慢的存储单元；

判断连接的存储单元数量是否大于第三预设值；若是，断开与选取出的传输速度最慢的存储单元之间的HTTP连接，将所述选取出的传输速度最慢的存储单元从选取出的文件组中剔除；在文件中的数据上传完成后，检测是否接收到大于或等于第三预设置个数的存储单元返回的文件物理信息；若是，则确定数据写入成功。

上述方法还具有以下特点：

所述将接收到的文件中的数据分别通过HTTP连接并行上传至选取出的文件组对应的第二预设值个数的存储单元上，包括：

将接收到的文件中的数据分别通过HTTP连接并以字节流的方式并行上传至选取出的文件组对应的第二预设值个数的存储单元上。

上述方法还具有以下特点：

所述当接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，确定数据写入成功，包括：

接收到各存储单元返回包含SHA1的文件物理信息；当接收到具有相同SHA1的文件物理信息大于或等于第三预设值个数时，确定数据写入成功。

本发明实施例提供的计算机可读存储介质，所述存储介质上存储有计算机程序，所述程序被处理器执行时实现上述方法的步骤。

本发明实施例提供的计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现所述方法的步骤。

本发明实施例提供的另一种基于多数派的数据存储方法，包括：存储单元接收前端服务器上传的文件中的数据；当确定所述文件中的数据接收完成后，向所述前端服务器发送所述文件的文件物理信息。

上述方法还具有以下特点：

所述当确定所述文件中的数据接收完成后，向所述前端服务器发送所述文件的文件物理信息，包括：

当确定所述文件中的数据接收完成后，向所述前端服务器发送包含SHA1的文件物理信息。

本发明实施例提供的一种装置，应用于前端服务器，包括：

接收单元被设置为接收文件上传请求，并根据所述文件上传请求从第一预设值个数的文件组中选取一个文件组；

上传单元被设置为接收文件中的数据，并根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上；

处理单元被设置为当确定文件中的数据上传完成，且接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，确定数据写入成功，再将文件中的元数据信息更新至数据库，此时，返回文件上传请求成功；

其中，所述第一预设值、第二预设值和第三预设值均为大于1的正整数，且第三预设值小于或等于第二预设值。

上述装置还具有以下特点：

每一文件组中分别存储有各存储单元对应的地址；则，

所述上传单元，还被设置为在将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上之前，根据选取出的文件组中存储的各存储单元对应的地址，同时与选取出的文件组中的每一存储单元建立 HTTP连接。

所述上传单元，具体被设置为接收文件中的数据，且每当接收到的文件中的数据的容量达到预设阈值时，根据选取出的文件组，将接收到的文件中的数据分别通过HTTP连接并行上传至选取出的文件组对应的第二预设值个数的存储单元上。

上述装置还具有以下特点：

所述前端服务器还包括检测单元：

所述检测单元被设置为检测每个存储单元的传输速度，并选取出传输速度最慢的存储单元；判断连接的存储单元数量是否大于第三预设值；若是，断开与选取出传输速度最慢的存储单元之间的HTTP连接，将所述选取出传输速度最慢的存储单元从选取出的文件组中剔除；在文件中的数据上传完成后,检测是否接收到大于或等于第三预设置个数的存储单元返回的文件物理信息；若是，则确定数据写入成功。

上述装置还具有以下特点：

所述处理单元，具体被设置为接收到各存储单元返回包含SHA1的文件物理信息；当接收到具有相同SHA1的文件物理信息大于或等于第三预设值个数时，确定数据写入成功。

本发明实施例还提供了一种装置，应用于存储单元，包括：接收单元，被设置为接收前端服务器上传的文件中的数据；发送单元被设置为当确定所述文件中的数据接收完成后，向所述前端服务器发送文件物理信息。

上述装置还具有以下特点：

所述发送单元，具体被设置为当确定所述文件中的数据接收完成后，向所述前端服务器发送包含SHA1的文件物理信息。

本发明有益效果如下：本发明实施例提供了一种基于多数派的数据存储方法、装置、存储介质及设备，在该方法中，前端服务器可根据接收到的文件上传请求从第一预设值个数的文件组中选取一个文件组，并根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上，且在确定文件中的数据上传完成，并接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，则数据写入成功，再将文件中的元数据信息更新至数据库，此时，返回文件上传请求成功。本文通过采用多数派成功方法写入文件，不会出现单点问题，且任意少数派的副本设备出现故障都不会造成数据丢失，另外，服务器采用流式透明代理的机制，将文件内容传输到每个文件副本上，减少了不必要的磁盘IO，且每个副本都是对等关系，不用维护设备之间的主从关系，从而提高了数据写入成功率。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，本发明实施例的示意性实施例及其说明用于解释本发明实施例，并不构成对本发明实施例的不当限定。在附图中：

图1所示为本发明实施例一所述的基于多数派的数据存储方法的流程示意图；

图2所示为本发明实施例一中系统拓扑结构图；

图3所示为本发明实施例二中的基于多数派的数据存储方法的流程示意图；

图4所示为本发明实施例三中的应用于前端服务器的装置的结构示意图；

图5所示为本发明实施例四中的应用于存储单元的装置的结构示意图；

图6所示为本发明实施例五中的基于多数派的数据存储系统的结构示意图。

具体实施方式

现结合附图和具体实施方式对本发明实施例进一步说明。

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

实施例一：

本发明实施例一提供了一种基于多数派的数据存储方法，如图1所示，其为本发明实施例一中的基于多数派的数据存储方法的流程示意图，此方法可包括以下步骤：

步骤101：前端服务器接收文件上传请求，并根据文件上传请求从第一预设值个数的文件组中选取一个文件组。

步骤102：接收文件中的数据，并根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上。

步骤103：当确定文件中的数据上传完成，且接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，则数据写入成功，再将文件中的元数据信息更新至数据库，此时，返回文件上传请求成功。

其中，第一预设值、第二预设值和第三预设值均为大于1的正整数，且第三预设值小于或等于第二预设值。

步骤101中不同文件组对应的存储单元的个数可以相同也可以不同。

例如，假设第一预设值为2，第二预设值为3，第三预设值为2，如图2所示(本发明实施例拓扑结构图)，在3个存储单元Store中存储数据副本，当有2个存储单元Store返回文件物理信息后(即多数派副本返回写入成功)，前端服务器Front即可确定数据写入成功，并将文件中的元数据信息更新至数据库DB，此时，返回文件上传请求成功，以供用户了解反馈信息，图中Group-x为文件组x，Group-y为文件组y，本发明实施例对此不做赘述。

也就是说，在本发明实施例通过采用多数派成功方法写入文件，不会出现单点问题，且任意少数派的副本设备出现故障都不会造成数据丢失，另外，服务器采用流式透明代理的机制，将文件内容传输到每个文件副本上，减少了不必要的磁盘IO。且每个副本都是对等关系，不用维护设备之间的主从关系，从而提高了数据写入成功率。

每一文件组中分别存储有各存储单元对应的地址；则，对于步骤102中，在将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上之前，此方法还可包括以下步骤：

根据选取出的文件组中存储的各存储单元对应的地址，同时与选取出的文件组中的每一存储单元建立HTTP连接。优选地，作为一个可执行方案，对于步骤102中，接收文件中的数据，并根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上，具体可包括：接收文件中的数据，且每当接收到的文件中的数据的容量达到预设阈值时，根据选取出的文件组，将接收到的文件中的数据分别通过HTTP连接并行上传至选取出的文件组对应的第二预设值个数的存储单元上。

例如，数据容量对应的预设阈值为1MB的数据，第二预设值为3个，这样每次前端服务器接收到1MB的数据后，就可以根据选取出的文件组，将接收到的1MB的数据分别通过HTTP连接并行上传至选取出的文件组对应的3个存储单元上。需要说明的是，前端服务器可为一个直接接收用户请求的nginx服务，可循环读取1M的缓冲区数据，同时处理数据库的访问，本发明实施例对此不作赘述。

优选地，作为一个可执行方案，将接收到的文件中的数据分别通过HTTP连接并行上传至选取出的的文件组对应的第二预设值个数的存储单元上，可具体执行为：将接收到的文件中的数据分别通过HTTP连接并以字节流的方式并行上传至选取出的文件组对应的第二预设值个数的存储单元上。服务器采用流式透明代理的机制，将文件内容传输到每个文件副本上，减少了不必要的磁盘IO。

为了提高文件的写入效率，此方法还可包括以下步骤A1-A5：步骤A1：检测每个存储单元的传输速度，并选取出传输速度最慢的存储单元。

步骤A2：判断连接的存储单元数量是否大于第三预设值。

步骤A3：若是，断开与选取出传输速度最慢的存储单元之间的HTTP连接，将选取出的传输速度最慢的存储单元从选取出的文件组中剔除。

步骤A4：在文件中的数据上传完成后,检测是否接收到大于或等于第三预设置个数的存储单元返回的文件物理信息。步骤A5：若是，则确定数据写入成功。

这样能够保证数据传输中的各通信线路的高效性，从而提高了数据写入的效率。

对于步骤103，当接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，确定数据写入成功，可具体包括如下步骤B1-B2：步骤B1：接收到各存储单元返回的包含SHA1的文件物理信息；

步骤B2：当接收到具有相同SHA1的文件物理信息大于或等于第三预设值个数时，确定数据写入成功。文件物理信息还可以包括MD5、数据大小(SIZE)等信息。

本发明实施例一提供了一种基于多数派的数据存储方法，在该方法中，前端服务器可根据接收到的文件上传请求从第一预设值个数的文件组中选取一个文件组，并根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上，且在确定文件中的数据上传完成，并接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，则数据写入成功，再将文件中的元数据信息更新至数据库，此时，返回文件上传请求成功。本文的技术方案，通过采用多数派成功方法写入文件，不会出现单点问题，且任意少数派的副本设备出现故障都不会造成数据丢失，另外，服务器采用流式透明代理的机制，将文件内容传输到每个文件副本上，减少了不必要的磁盘IO，且每个副本都是对等关系，不用维护设备之间的主从关系，提高了数据写入成功率。

实施例二基于与本发明实施例一相同的发明构思，本发明实施例二以存储单元为执行主体，提供了一种基于多数派的数据存储方法，其流程示意图如图3所示，此方法可包括以下步骤：

步骤301：存储单元接收前端服务器上传的文件中的数据。

步骤302：当确定文件中的数据接收完成后，向前端服务器发送上述文件的文件物理信息。

对于步骤302，当确定文件中的数据接收完成后，向前端服务器发送上述文件的文件物理信息，可具体之行为：当确定文件中的数据接收完成后，向前端服务器发送包含SHA1的文件物理信息。文件物理信息还可以包括MD5、数据大小(SIZE)等信息。

本文的技术方案，通过采用多数派成功方法写入文件，不会出现单点问题，且任意少数派的副本设备出现故障都不会造成数据丢失，另外，服务器采用流式透明代理的机制，将文件内容传输到每个文件副本上，减少了不必要的磁盘IO，且每个副本都是对等关系，不用维护设备之间的主从关系，提高了数据写入成功率。

以前端服务器和存储单元交互为例，对本文进行详细说明，具体细节描述可参见上述实施例一和实施例二中的相关描述，重复之处不再赘述，下面简单描述一下整体流程。

1、前端服务器接收到一个文件上传写入请求，选择1个文件组，文件组中保存了3个存储单元对应的存储地址，前端服务器同时建立到3个前端服务器到存储单元的HTTP连接。

2、前端服务器循环读取1M的缓冲区数据，每一个存储单元创建一个线程，并发的将缓冲区数据传输到3个存储单元，与此同时，检测每个存储单元的传输速度，每次发送完缓冲区数据时检查是否能构成多数派的存储单元能成功，且在能保证多数派成功的情况下，将传输速度慢的存储单元主动剔除，即断开该数据传输的HTTP链接。

3、文件内容全部发送完后，接收3个存储单元返回包含SHA1的文件物理信息，由于同一个物理文件的SHA1一定相同，当有2(3/2+1＝2)以上的多数派存储单元返回的SHA1相同时，则存储单元写入成功。

4、前端服务器更新完元数据信息后，返回一次文件上传请求成功。需要说明的是，对于返回文件上传请求成功后，多数派副本被正确的写入的数据，文件的访问可以从任何一个正确写入的副本读取数据。

本发明实施例二提供的一种基于多数派的数据存储方法，通过采用多数派成功方法写入文件，不会出现单点问题，且任意少数派的副本设备出现故障都不会造成数据丢失，另外，服务器采用流式透明代理的机制，将文件内容传输到每个文件副本上，减少了不必要的磁盘IO，且每个副本都是对等关系，不用维护设备之间的主从关系，提高了数据写入成功率。

实施例三基于与本发明实施例一相同的发明构思，本发明实施例三提供了一种应用于前端服务器的装置，具体实施可参见上述方法实施例一中的相关描述，重复之处不再赘述，其结构示意图如图4所示，该装置包括：

接收单元41被设置为被设置为接收文件上传请求，并根据文件上传请求从第一预设值个数的文件组中选取一个文件组，其中，每一文件组对应第二预设值个数的存储单元；

上传单元42被设置为接收文件中的数据，并根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上；

处理单元43被设置为当确定文件中的数据上传完成，且接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，则数据写入成功，再将文件中的元数据信息更新至数据库，此时，返回文件上传请求成功；

每一文件组中分别存储有各存储单元对应的地址；则，上传单元42，还可被设置为在将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上之前，根据选取出的的文件组中存储的各存储单元对应的地址，同时与选取出的文件组中的每一存储单元建立HTTP连接。

作为一个可执行方法，上传单元42可具体被设置为接收文件中的数据，且每当接收到的文件中的数据的容量达到预设阈值时，根据选取出的文件组，将接收到的文件中的数据分别通过HTTP连接并行上传至选取出的文件组对应的第二预设值个数的存储单元上。

作为一个可执行方法，前端服务器还包括检测单元44：检测单元44被设置为检测每个存储单元的传输速度，并选取出传输速度最慢的存储单元；判断连接的存储单元数量是否大于第三预设值；若是，断开与选取出的传输速度最慢的存储单元之间的HTTP连接，将选取出传输速度最慢的存储单元从选取出的文件组中剔除；在文件中的数据上传完成后,检测是否接收到大于或等于第三预设置个数的存储单元返回的文件物理信息；若是，则确定数据写入成功。

优选地，上传单元42可具体被设置为将接收到的文件中的数据分别通过HTTP连接并以字节流的方式并行上传至选取出的文件组对应的第二预设值个数的存储单元上。

进一步地，处理单元43可具体被设置为接收到各存储单元返回的包含SHA1的文件物理信息；当接收到相同SHA1的文件物理信息大于或等于第三预设值个数时，确定数据写入成功。

本发明实施例三提供了一种前端服务器，前端服务器可根据接收到的文件上传请求从第一预设值个数的文件组中选取一个文件组，并根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上，且在确定文件中的数据上传完成，并接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，则数据写入成功，再将文件中的元数据信息更新至数据库，此时，返回文件上传请求成功。本文通过采用多数派成功方法写入文件，不会出现单点问题，且任意少数派的副本设备出现故障都不会造成数据丢失，另外，服务器采用流式透明代理的机制，将文件内容传输到每个文件副本上，减少了不必要的磁盘IO，且每个副本都是对等关系，不用维护设备之间的主从关系，提高了数据写入成功率。

实施例四基于与本发明实施例二相同的发明构思，本发明实施例四提供了一种应用于存储单元的装置，具体实施可参见上述方法实施例二中的相关描述，重复之处不再赘述，其结构示意图如图5所示，该装置包括：

接收单元51被设置为接收前端服务器上传的文件中的数据；

发送单元52被设置为当确定文件中的数据接收完成后，向前端服务器发送文件物理信息。

进一步地，发送单元52，可具体被设置为当确定文件中的数据接收完成后，向前端服务器发送包含SHA1的文件物理信息。

本发明实施例四提供了一种存储单元，写入文件通过采用多数派成功方法，不会出现单点问题，且任意少数派的副本设备出现故障，都不会造成数据丢失，另外，服务器采用流式透明代理的机制，将文件内容传输到每个文件副本上，减少了不必要的磁盘IO，且每个副本都是对等关系，不用维护设备之间的主从关系，提高了数据写入成功率。

实施例五基于与本发明实施例一、二相同的发明构思，本发明实施例五提供了一种基于多数派的数据存储系统，该系统的具体实施可参见上述方法实施例一、二中的相关描述，重复之处不再赘述，其结构示意图如图6所示，该系统主要可包括：

前端服务器61被设置为接收文件上传请求，并根据文件上传请求从第一预设值个数的文件组中选取一个文件组，其中，每一文件组对应第二预设值个数的存储单元；接收文件中的数据，并根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上；当确定文件中的数据上传完成，且接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，则数据写入成功，再将文件中的元数据信息更新至数据库，此时，返回文件上传请求成功；其中，第一预设值、第二预设值和第三预设值均为大于1的正整数，且第三预设值小于或等于第二预设值。存储单元62被设置为接收前端服务器上传的文件中的数据，并当确定文件中的数据接收完成后，向前端服务器发送文件物理信息。本发明实施例五提供了一种基于多数派的数据存储系统，前端服务器可根据接收到的文件上传请求从第一预设值个数的文件组中选取一个文件组，并根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上，且在确定文件中的数据上传完成，并接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，则数据写入成功，再将文件中的元数据信息更新至数据库，此时，返回文件上传请求成功。本文通过采用多数派成功方法写入文件，不会出现单点问题，且任意少数派的副本设备出现故障都不会造成数据丢失，另外，服务器采用流式透明代理的机制，将文件内容传输到每个文件副本上，减少了不必要的磁盘IO，且每个副本都是对等关系，不用维护设备之间的主从关系，提高了数据写入成功率。

本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，均应涵盖在权利要求范围当中。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

工业实用性

本文通过采用多数派成功方法写入文件，不会出现单点问题，且任意少数派的副本设备出现故障都不会造成数据丢失，另外服务器采用流式代理，将文件内容传输到各副本上，可减少磁盘IO占用。

Claims

一种基于多数派的数据存储方法，包括：

前端服务器接收文件上传请求，根据所述文件上传请求从第一预设值个数的文件组中选取一个文件组；

接收文件中的数据，根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上；

当确定文件中的数据上传完成且接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，确定数据写入成功，将文件中的元数据信息更新至数据库；

其中，所述第一预设值、所述第二预设值和所述第三预设值均为大于1的正整数，且所述第三预设值小于或等于所述第二预设值。
如权利要求1所述的方法，其中，每一文件组中分别存储有各存储单元对应的地址；

所述将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上之前，所述方法还包括：

根据选取出的文件组中存储的各存储单元对应的地址，同时与选取出的文件组中的每一存储单元建立HTTP连接。
如权利要求2所述的方法，其中，所述接收文件中的数据，根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上，包括：

接收文件中的数据，每当接收到的文件中的数据的容量达到预设阈值时，根据选取出的文件组，将接收到的文件中的数据分别通过HTTP连接并行上传至选取出的文件组对应的第二预设值个数的存储单元上。
如权利要求3所述的方法，其中，所述方法还包括：检测每个存储单元的传输速度，并选取出传输速度最慢的存储单元；

判断连接的存储单元数量是否大于第三预设值；若是，断开与选取出的传输速度最慢的存储单元之间的HTTP连接，将所述选取出的传输速度最慢的存储单元从选取出的文件组中剔除；在文件中的数据上传完成后，检测是否接收到大于或等于第三预设置个数的存储单元返回的文件物理信息；若是，则确定数据写入成功。
如权利要求3所述的方法，其中，所述将接收到的文件中的数据分别通过HTTP连接并行上传至选取出的文件组对应的第二预设值个数的存储单元上，包括：

将接收到的文件中的数据分别通过HTTP连接并以字节流的方式并行上传至选取出的文件组对应的第二预设值个数的存储单元上。
如权利要求1所述的方法，其中，所述当接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，确定数据写入成功，包括：

接收到各存储单元返回包含SHA1的文件物理信息；当接收到具有相同SHA1的文件物理信息大于或等于第三预设值个数时，确定数据写入成功。
一种计算机可读存储介质，所述存储介质上存储有计算机程序，所述程序被处理器执行时实现权利要求1至6中任意一项所述方法的步骤。
一种计算机设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至6中任意一项所述方法的步骤。
一种基于多数派的数据存储方法，包括：存储单元接收前端服务器上传的文件中的数据；当确定所述文件中的数据接收完成后，向所述前端服务器发送所述文件的文件物理信息。
如权利要求9所述的方法，其中，所述当确定所述文件中的数据接收完成后，向所述前端服务器发送所述文件的文件物理信息，包括：

当确定所述文件中的数据接收完成后，向所述前端服务器发送包含SHA1的文件物理信息。
一种装置，应用于前端服务器，包括：

接收单元被设置为接收文件上传请求，并根据所述文件上传请求从第一预设值个数的文件组中选取一个文件组；

上传单元被设置为接收文件中的数据，并根据选取出的文件组，将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上；

处理单元被设置为当确定文件中的数据上传完成，且接收到大于或等于第三预设值个数的存储单元返回的文件物理信息时，确定数据写入成功，再将文件中的元数据信息更新至数据库，此时，返回文件上传请求成功；

其中，所述第一预设值、第二预设值和第三预设值均为大于1的正整数，且第三预设值小于或等于第二预设值。
如权利要求11所述的装置，其中，每一文件组中分别存储有各存储单元对应的地址；

所述上传单元，还被设置为在将接收到的文件中的数据分别上传至选取出的文件组对应的第二预设值个数的存储单元上之前，根据选取出的文件组中存储的各存储单元对应的地址，同时与选取出的文件组中的每一存储单元建立HTTP连接；还被设置为每当接收到的文件中的数据的容量达到预设阈值时，根据选取出的文件组，将接收到的文件中的数据分别通过HTTP连接并行上传至选取出的文件组对应的第二预设值个数的存储单元上。
如权利要求11所述的装置，其中，所述前端服务器还包括检测单元：

所述检测单元被设置为检测每个存储单元的传输速度，并选取出传输速度最慢的存储单元；判断连接的存储单元数量是否大于第三预设值；若是，断开与选取出传输速度最慢的存储单元之间的HTTP连接，将所述选取出传输速度最慢的存储单元从选取出的文件组中剔除；在文件中的数据上传完成后,检测是否接收到大于或等于第三预设置个数的存储单元返回的文件物理信息；若是，则确定数据写入成功。
如权利要求11所述的装置，其中，所述处理单元，具体被设置为接收到各存储单元返回包含SHA1的文件物理信息；当接收到具有相同SHA1的文件物理信息大于或等于第三预设值个数时，确定数据写入成功。
一种装置，应用于存储单元，包括：接收单元，被设置为接收前端服务器上传的文件中的数据；发送单元被设置为当确定所述文件中的数据接收完成后，向所述前端服务器发送文件物理信息。
如权利要求15所述的装置，其中，所述发送单元，具体用于当确定所述文件中的数据接收完成后，向所述前端服务器发送包含SHA1的文件物理信息。