WO2018214905A1

WO2018214905A1 - 一种数据存储的方法、装置、介质及设备

Info

Publication number: WO2018214905A1
Application number: PCT/CN2018/087991
Authority: WO
Inventors: 张炎泼
Original assignee: 贵州白山云科技有限公司
Priority date: 2017-05-26
Filing date: 2018-05-23
Publication date: 2018-11-29
Also published as: CN107707600B; CN107707600A

Abstract

本文公开了一种数据存储方法及装置，此方法包括：对文件存储区域进行分组，设置每个分组的存储容量；接收客户端发送的文件上传请求，文件上传请求包括待上传文件的文件标识和根据预设算法计算出的所述待上传文件的校验块；确定待上传文件的信息，包括所述待上传文件的文件标识、所述待上传文件的原始数据和所述校验块；确定目标分组，包括：确定各分组的文件标识范围，根据所述待上传文件的文件标识和各分组的文件标识范围，将文件标识范围包含所述待上传文件的文件标识的分组并且剩余存储量不小于待上传文件信息占用的存储量的分组作为目标分组；将所述待上传文件的信息存储至所述目标分组。本文可以提高文件管理科学性，提高存储速度。

Description

一种数据存储的方法、装置、介质及设备

本申请要求在2017年5月26日提交中国专利局、申请号为201710386030.4发明名称为“一种数据存储方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本文涉及但不限于涉及云存储技术领域，尤其涉及一种数据存储方法及装置、介质及设备。

背景技术

现有的分布式数据存储系统一般采用固定的数据副本(如2副本或3副本)，其主要缺点是对于数据存储区域中存储的访问次数较少的冷数据，需要同样占用多副本存储空间，使得无法腾出较多的存储空间给数据存储节点中存储的访问次数较多的热点数据使用，造成存储空间的有效利用率较低。

为了节省冷数据占用的存储空间，现有技术中，利用纠删码(Erasure Coding)算法对文件内容进行编码，当文件内容损坏时，可以利用该编码将文件内容回复，这样减少了冷数据因存储副本占用的存储空间。

当用户下载文件时，需要在存储空间中逐个查找存储的文件，导致系统资源被长时间占用，这样会对系统正常的操作产生一定的影响和干扰。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

为了解决上述技术问题，本发明实施例提供了一种数据存储方法及装置、介质及设备。

本发明实施例提供的数据存储方法包括：

步骤1，对文件存储区域进行分组，设置每个分组的存储容量；

步骤2，接收客户端发送的文件上传请求，所述文件上传请求包括待上传文件的文件标识和根据预设算法计算出的所述待上传文件的校验块；确定所述待上传文件的信息，包括所述待上传文件的文件标识、所述待上传文件的原始数据和所述校验块；

步骤3，确定目标分组，包括：确定各分组的文件标识范围，根据所述待上传文件的文件标识和各分组的文件标识范围，将文件标识范围包含所述待上传文件的文件标识的分组并且剩余存储量不小于待上传文件信息占用的存储量的分组作为目标分组；

步骤4，将所述待上传文件的信息存储至所述目标分组。

上述方法还具有以下特点：

所述确定各分组的文件标识范围包括：确定各分组中包含的所有文件标识的涵盖范围，未存入任何信息的分组的文件标识范围和只存入一个文件标识的分组的文件标识范围为最大范围。

上述方法还具有以下特点：

所述步骤3还包括：在所述文件标识范围不是所述最大范围的分组中，如果各分组的所述文件标识范围均不涵盖所述待上传文件的文件标识，或者只有一个分组内的所述文件标识范围涵盖所述待上传文件的文件标识且该分组的剩余存储量小于所述待上传文件信息占用的存储量，则将已存储文件信息且剩余存储量不小于所述待上传文件信息占用的存储量的分组作为所述目标分组；

如果已存储文件信息的每个分组的剩余存储量均小于所述待上传文件信息占用的存储量，则将未存储文件信息的分组作为所述目标分组。

上述方法还具有以下特点：

所述步骤3还包括：如果所述分组中有多个分组中的文件标识范围均涵盖所述待上传文件的文件标识且不是所述最大范围，且所述多个分组中的每一个的剩余存储量均小于所述待上传文件信息占用的存储量，新建与此多个分组的总数量相同的新的分组，将原多个分组中已存储的各文件和待上传文件按文件标识依次排序后确定待上传文件的位置所对应的分组，将此分组作为目标分组，并原多个分组中已存储的各文件存储到新的分组，删除原多个分组。

上述方法还具有以下特点：

所述步骤4还包括：当将多个分组中的文件信息和所述待上传文件的文件信息一起存入多个目标分组时，将待存入所述多个目标分组的文件信息根据预设的文件标识的排序方式依次存入所述多个目标分组中，将所述多个分组中存储的文件信息删除；

当所述目标分组的总存储量小于待存入的文件信息总的占用的存储量时，按所述步骤3中确定目标分组的方法重新确定存储无法存入所述目标分组的文件信息的目标分组。

上述方法还具有以下特点：

所述方法还包括：按预设的时间周期定时检查文件存储区内是否存在损坏的文件，如果存在损坏的文件，则根据预设的算法，利用所述校验块将所述损坏的文件的原始数据恢复。

上述方法还具有以下特点：

所述按预设的时间周期定时检查文件存储区内是否存在损坏的文件包括：按预设的时间周期定时地根据所述文件存储区内所有的文件的原始数据计算对应的文件标识，如果计算得到的所述文件标识与存储的文件标识不一致，则判断此文件损坏。

上述方法还具有以下特点：

所述方法还包括：接收客户端发送的文件下载请求，所述文件下载请求包括待下载文件的文件标识，在所述文件标识范围涵盖所述待下载文件的文件标识的分组中查找与所述待下载文件的文件标识相同的文件标识，如果不存在与所述待下载文件的文件标识相同的文件标识，则在其余的所述分组中查找与所述待下载文件的文件标识相同的文件标识，将与所述待下载文件的文件标识相同的文件标识对应的文件的原始数据发送至客户端。

上述方法还具有以下特点：

所述方法还包括：接收客户端发送的文件删除请求，所述文件删除请求包括待删除文件的文件标识，在所述文件标识范围涵盖所述待删除文件的文件标识的分组中查找与所述待删除文件的文件标识相同的文件标识，如果不存在与所述待删除文件的文件标识相同的文件标识，则在其余的所述分组中查找与所述待删除文件的文件标识相同的文件标识，将与所述待删除文件的文件标识相同的文件标识对应的文件信息删除，记录删除的文件属性，所述文件属性包括所述文件标识，还包括但不限于以下信息中至少一种：文件名、文件删除时间、文件上传时间和文件存储地址。

上述方法还具有以下特点：

所述文件标识为利用预设的加密算法对文件原始数据进行计算得到的文件的唯一标识。

本发明实施例提供的数据存储的装置，所述装置包括：

分组模块，设置为对文件存储区域进行分组，设置每个分组的存储容量；

上传请求接收模块，设置为接收客户端发送的文件上传请求，所述文件上传请求包括待上传文件的文件标识和根据预设算法计算出的所述待上传文件的校验块；

文件信息确定模块，设置为确定所述待上传文件的信息，包括所述待上传文件的文件标识、所述待上传文件的原始数据和所述校验块；

目标分组确定模块，设置为确定目标分组，包括：确定各分组的文件标识范围，根据所述待上传文件的文件标识和各分组的文件标识范围，将文件标识范围包含所述待上传文件的文件标识的分组并且剩余存储量不小于待上传文件信息占用的存储量的分组作为目标分组；

上传文件管理模块，设置为将所述待上传文件的信息存储至所述目标分组。

上述装置还具有以下特点：

所述目标分组确定模块包括文件标识范围确定单元，设置为确定各分组中包含的所有文件标识的涵盖范围，未存入任何信息的分组的文件标识范围和只存入一个文件标识的分组的文件标识范围为最大范围。

上述装置还具有以下特点：

所述目标分组确定模块，还设置为在所述文件标识范围不是所述最大范围的分组中，各分组的所述文件标识范围均不涵盖所述待上传文件的文件标识，或者只有一个分组内的所述文件标识范围涵盖所述待上传文件的文件标识且该分组的剩余存储量小于所述待上传文件信息占用的存储量，则将已存储文件信息且剩余存储量不小于所述待上传文件信息占用的存储量的分组作为所述目标分组；

上述装置还具有以下特点：

所述目标分组确定模块，还设置为在所述分组中有多个分组中的文件标识范围均涵盖所述待上传文件的文件标识且不是所述最大范围且所述多个分组中的每一个的剩余存储量均小于所述待上传文件信息占用的存储量时，新建与此多个分组的总数量相同的新的分组，将原多个分组中已存储的各文件和待上传文件按文件标识依次排序后确定待上传文件的位置所对应的分组，将此分组作为目标分组，并原多个分组中已存储的各文件存储到新的分组，删除原多个分组。

上述装置还具有以下特点：

所述上传文件管理模块，还设置为当将多个分组中的文件信息和所述待上传文件的文件信息一起存入多个目标分组时，将待存入所述多个目标分组的文件信息根据预设的文件标识的排序方式依次存入所述多个目标分组中，将所述多个分组中存储的文件信息删除；

当所述目标分组的总存储量小于待存入的文件信息总的占用的存储量时，目标分组确定模块重新确定存储无法存入所述目标分组的文件信息的目标分组。

上述装置还具有以下特点：

所述装置还包括检查模块，设置为按预设的时间周期定时检查文件存储区内是否存在损坏的文件，如果存在损坏的文件，则根据预设的算法，利用所述校验块将所述损坏的文件的原始数据恢复。

上述装置还具有以下特点：

所述检查模块包括计算单元，设置为按预设的时间周期定时地根据所述文件存储区内所有的文件的原始数据计算对应的文件标识，如果计算得到的所述文件标识与存储的文件标识不一致，则判断此文件损坏。

上述装置还具有以下特点：

所述装置还包括下载管理模块，设置为接收客户端发送的文件下载请求，所述文件下载请求包括待下载文件的文件标识，在所述文件标识范围涵盖所述待下载文件的文件标识的分组中查找与所述待下载文件的文件标识相同的文件标识，如果不存在与所述待下载文件的文件标识相同的文件标识，则在其余的所述分组中查找与所述待下载文件的文件标识相同的文件标识，将与所述待下载文件的文件标识相同的文件标识对应的文件的原始数据发送至客户端。

上述装置还具有以下特点：

所述装置还包括删除管理模块，设置为接收客户端发送的文件删除请求，所述文件删除请求包括待删除文件的文件标识，在所述文件标识范围涵盖所述待删除文件的文件标识的分组中查找与所述待删除文件的文件标识相同的文件标识，如果不存在与所述待删除文件的文件标识相同的文件标识，则在其余的所述分组中查找与所述待删除文件的文件标识相同的文件标识，将与所述待删除文件的文件标识相同的文件标识对应的文件信息删除，记录删除的文件属性，所述文件属性包括所述文件标识，还包括但不限于以下信息中至少一种：文件名、文件删除时间、文件上传时间和文件存储地址。

上述装置还具有以下特点：

本发明实施例提供的计算机可读存储介质上存储有计算机程序，所述程序被处理器执行时实现上述方法的步骤。

本发明实施例提供的计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方法的步骤。

本发明实施例可以提高文件管理科学性，提高存储速度。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，本发明实施例的示意性实施例及其说明用于解释本发明实施例，并不构成对本发明实施例的不当限定。在附图中：

图1是实施例一提供的数据存储方法的流程图；

图2是实施例二提供的数据存储装置的结构示意图。

具体实施方式

现结合附图和具体实施方式对本发明实施例进一步说明。

下面结合附图详细描述本发明的示例性实施例数据存储方法及装置。

实施例一

图1是示出根据本发明实施例一的数据存储方法的流程图。此方法典型的应用于用于存储的服务器，参照图1，此方法包括：

步骤101，对文件存储区域进行分组，设置每个分组的存储容量；

步骤102，接收客户端发送的文件上传请求，文件上传请求包括待上传文件的文件标识和根据预设算法计算出的待上传文件的校验块；确定待上传文件的信息，包括待上传文件的文件标识、待上传文件的原始数据和校验块；

步骤103，确定目标分组，包括：确定各分组的文件标识范围，根据待上传文件的文件标识和各分组的文件标识范围，将文件标识范围包含待上传文件的文件标识的分组并且剩余存储量不小于待上传文件信息占用的存储量的分组作为目标分组；

步骤104，将待上传文件的信息存储至目标分组。

上述数据存储方法中文件标识为利用预设的加密算法对文件原始数据进行计算得到的文件的唯一标识，例如，采用安全哈希算法(SHA1)对文件原始数据内容进行计算得到的SHA1值为文件的唯一标识。

上述步骤103中，确定各分组的文件标识范围包括：确定各分组中包含的所有文件标识的涵盖范围，未存入任何信息的分组的文件标识范围和只存入一个文件标识的分组的文件标识范围为最大范围。

例如，某分组中存储的文件标识中，最小的文件标识为aaa，最大的文件标识为bbb，则该分组的文件标识范围为aaa～bbb，将没有存储任何文件信息和只存储了一个文件标识的分组的文件标识范围标记为MAX。

上述步骤103还包括：在文件标识范围不是最大范围的分组中，如果各分组的文件标识范围均不涵盖待上传文件的文件标识，或者只有一个分组内的文件标识范围涵盖待上传文件的文件标识且该分组的剩余存储量小于待上传文件信息占用的存储量，则将已存储文件信息且剩余存储量不小于待上传文件信息占用的存储量的分组作为目标分组；

如果已存储文件信息的每个分组的剩余存储量均小于待上传文件信息占用的存储量，则将未存储文件信息的分组作为目标分组。

上述步骤103还包括：如果分组中有多个分组中的文件标识范围均涵盖待上传文件的文件标识且不是最大范围，且多个分组中的每一个的剩余存储量均小于待上传文件信息占用的存储量新建与此多个分组的总数量相同的新的分组，将原多个分组中已存储的各文件和待上传文件按文件标识依次排序后确定待上传文件的位置所对应的分组，将此分组作为目标分组，并原多个分组中已存储的各文件存储到新的分组，删除原多个分组。

上述步骤104还包括：当将多个分组中的文件信息和待上传文件的文件信息一起存入多个目标分组时，将待存入多个目标分组的文件信息根据预设的文件标识的排序方式依次存入多个目标分组中，将多个分组中存储的文件信息删除；

当多个目标分组的总存储量小于待存入的文件信息总的占用的存储量时，按步骤103中确定目标分组的方法重新确定存储无法存入多个目标分组的文件信息的目标分组。

例如，待上传文件的文件标识为abc123，该文件的文件信息占用的存储量为100MB，第一分组的文件标识范围为abc000～abc300，第二分组的文件标识范围为abc100～abc400，这两个分组的文件标识范围有重叠部分且均能够涵盖待上传文件的文件标识，并且这两个分组的剩余存储量均小于100MB，则在未存储任何文件信息的分组中确定两个分组作为存储第一分组和第二分组中的全部文件信息和待上传文件的文件信息的目标分组。

预设文件标识的排序方式为从小到大，将第一分组中的文件信息、第二分组中的文件信息和待上传文件的文件信息按文件标识从小到大的顺序依次存入两个目标分组中，此时，两个目标分组的文件标识范围没有了重叠部分，如果两个目标分组无法容纳所有的待存入的文件信息，则按上述步骤103重新确定存储剩余的未存入这两个目标分组的文件信息的目标分组。

当确定目标分组的时候，可以以轮循的方式查询各分组，也可以按预设的分组编号选择，分组的编号顺序代表向各分组存储文件时的优先级别，当多个分组均满足目标分组的条件时，向优先级别最高的分组中存储文件信息。

上述数据存储方法还包括：按预设的时间周期(此时间周期的值可以是系统默认的固定值也可以是可人工设置的变量值)定时检查文件存储区内是否存在损坏的文件，如果存在损坏的文件，则根据预设的算法，利用校验块将损坏的文件的原始数据恢复。

上述按预设的时间周期定时检查文件存储区内是否存在损坏的文件包括：按预设的时间周期定时地根据文件存储区内所有的文件的原始数据计算对应的文件标识，如果计算得到的文件标识与存储的文件标识不一致，则判断此文件损坏。

例如，设置每个月第一天的零点检查文件存储区内是否存在损坏的文件，如果存在损坏的文件，按预设的算法根据校验块将损坏的文件原始数据恢复。

上述数据存储方法还包括：接收客户端发送的文件下载请求，文件下载请求包括待下载文件的文件标识，在文件标识范围涵盖待下载文件的文件标识的分组中查找与待下载文件的文件标识相同的文件标识，如果不存在与待下载文件的文件标识相同的文件标识，则在其余的分组中查找与待下载文件的文件标识相同的文件标识，将与待下载文件的文件标识相同的文件标识对应的文件的原始数据发送至客户端。

上述数据存储方法还包括：接收客户端发送的文件删除请求，文件删除请求包括待删除文件的文件标识，在文件标识范围涵盖待删除文件的文件标识的分组中查找与待删除文件的文件标识相同的文件标识，如果不存在与待删除文件的文件标识相同的文件标识，则在其余的分组中查找与待删除文件的文件标识相同的文件标识，将与待删除文件的文件标识相同的文件标识对应的文件信息删除，记录删除的文件属性，文件属性包括文件标识，还包括但不限于以下信息的至少一种：文件名、文件删除时间、文件上传时间和文件存储地址。

实施例二

图2是示出根据本发明实施例二的数据存储装置的结构示意图。参照图2，所述装置包括：

分组模块201，设置为对文件存储区域进行分组，设置每个分组的存储容量；

上传请求接收模块202，设置为接收客户端发送的文件上传请求，文件上传请求包括待上传文件的文件标识和根据预设算法计算出的待上传文件的校验块；

文件信息确定模块203，设置为确定待上传文件的信息，包括待上传文件的文件标识、待上传文件的原始数据和校验块；

目标分组确定模块204，设置为确定目标分组，包括：确定各分组的文件标识范围，根据待上传文件的文件标识和各分组的文件标识范围，将文件标识范围包含待上传文件的文件标识的分组并且剩余存储量大于待上传文件信息占用的存储量的分组作为目标分组；

上传文件管理模块205，设置为将待上传文件的信息存储至目标分组。

目标分组确定模块204包括文件标识范围确定单元2041，设置为确定各分组中包含的所有文件标识的涵盖范围，未存入任何信息的分组的文件标识范围和只存入一个文件标识的分组的文件标识范围为最大范围。

目标分组确定模块204，还设置为在文件标识范围不是最大范围的分组中，如果各分组的文件标识范围均不涵盖待上传文件的文件标识，或者只有一个分组内的文件标识范围涵盖待上传文件的文件标识且该分组的剩余存储量小于待上传文件信息占用的存储量，则将已存储文件信息且剩余存储量大于待上传文件信息占用的存储量的分组作为目标分组；

目标分组确定模块204，还设置为在分组中有多个分组中的文件标识范围均涵盖待上传文件的文件标识且不是最大范围且多个分组中的每一个的剩余存储量均小于待上传文件信息占用的存储量时，新建与此多个分组的总数量相同的新的分组，将原多个分组中已存储的各文件和待上传文件按文件标识依次排序后确定待上传文件的位置所对应的分组，将此分组作为目标分组，并原多个分组中已存储的各文件存储到新的分组，删除原多个分组。

上传文件管理模块205，还设置为当将多个分组中的文件信息和待上传文件的文件信息一起存入多个目标分组时，将待存入多个目标分组的文件信息根据预设的文件标识的排序方式依次存入多个目标分组中，将多个分组中存储的文件信息删除；

当目标分组的总存储量小于待存入的文件信息总的占用的存储量时，目标分组确定模块204重新确定存储无法存入目标分组的文件信息的目标分组。

上述装置还包括检查模块206，设置为按预设的时间周期定时检查文件存储区内是否存在损坏的文件，如果存在损坏的文件，则根据预设的算法，利用校验块将损坏的文件的原始数据恢复。

检查模块206包括计算单元2061，设置为按预设的时间周期定时地根据文件存储区内所有的文件的原始数据计算对应的文件标识，如果计算得到的文件标识与存储的文件标识不一致，则判断此文件损坏。

上述装置还包括下载管理模块207，设置为接收客户端发送的文件下载请求，文件下载请求包括待下载文件的文件标识，在文件标识范围涵盖待下载文件的文件标识的分组中查找与待下载文件的文件标识相同的文件标识，如果不存在与待下载文件的文件标识相同的文件标识，则在其余的分组中查找与待下载文件的文件标识相同的文件标识，将与待下载文件的文件标识相同的文件标识对应的文件的原始数据发送至客户端。

上述装置还包括删除管理模块208，设置为接收客户端发送的文件删除请求，文件删除请求包括待删除文件的文件标识，在文件标识范围涵盖待删除文件的文件标识的分组中查找与待删除文件的文件标识相同的文件标识，如果不存在与待删除文件的文件标识相同的文件标识，则在其余的分组中查找与待删除文件的文件标识相同的文件标识，将与待删除文件的文件标识相同的文件标识对应的文件信息删除，记录删除的文件属性，文件属性包括文件标识，还包括但不限于以下信息中至少一种：文件名、文件删除时间、文件上传时间和文件存储地址。

上述文件标识为利用预设的加密算法对文件原始数据进行计算得到的文件的唯一标识。

本发明实施例提供的数据存储方法及装置，以分组的方式管理文件存储空间，当需要从各分组中查找文件时，根据分组的文件标识范围确定目标文件的位置，而利用本发明实施例提供的方法及装置，在将文件上传至存储空间之前，可以消除多个分组的文件标识范围的重叠部分，缩小了查找的范围，提高了查找的效率。

上面描述的内容可以单独地或者以各种方式组合起来实施，而这些变型方式都在本发明实施例的保护范围之内。

本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，均应涵盖在权利要求范围当中。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

工业实用性

Claims

一种数据存储的方法，包括：

步骤1，对文件存储区域进行分组，设置每个分组的存储容量；

步骤2，接收客户端发送的文件上传请求，所述文件上传请求包括待上传文件的文件标识和根据预设算法计算出的所述待上传文件的校验块；确定所述待上传文件的信息，包括所述待上传文件的文件标识、所述待上传文件的原始数据和所述校验块；

步骤3，确定目标分组，包括：确定各分组的文件标识范围，根据所述待上传文件的文件标识和各分组的文件标识范围，将文件标识范围包含所述待上传文件的文件标识的分组并且剩余存储量不小于待上传文件信息占用的存储量的分组作为目标分组；

步骤4，将所述待上传文件的信息存储至所述目标分组。
如权利要求1所述的方法，其中，

所述确定各分组的文件标识范围包括：确定各分组中包含的所有文件标识的涵盖范围，未存入任何信息的分组的文件标识范围和只存入一个文件标识的分组的文件标识范围为最大范围。
如权利要求2所述的方法，其中，

所述步骤3还包括：在所述文件标识范围不是所述最大范围的分组中，如果各分组的所述文件标识范围均不涵盖所述待上传文件的文件标识，或者只有一个分组内的所述文件标识范围涵盖所述待上传文件的文件标识且该分组的剩余存储量小于所述待上传文件信息占用的存储量，则将已存储文件信息且剩余存储量不小于所述待上传文件信息占用的存储量的分组作为所述目标分组；

如果已存储文件信息的每个分组的剩余存储量均小于所述待上传文件信息占用的存储量，则将未存储文件信息的分组作为所述目标分组。
如权利要求2所述的方法，其中，

所述步骤3还包括：如果所述分组中有多个分组中的文件标识范围均涵盖所述待上传文件的文件标识且不是所述最大范围，且所述多个分组中的每一个的剩余存储量均小于所述待上传文件信息占用的存储量，新建与此多个分组的总数量相同的新的分组，将原多个分组中已存储的各文件和待上传文件按文件标识依次排序后确定待上传文件的位置所对应的分组，将此分组作为目标分组，并原多个分组中已存储的各文件存储到新的分组，删除原多个分组。
如权利要求4所述的方法，其中，

所述步骤4还包括：当将多个分组中的文件信息和所述待上传文件的文件信息一起存入多个目标分组时，将待存入所述多个目标分组的文件信息根据预设的文件标识的排序方式依次存入所述多个目标分组中，将所述多个分组中存储的文件信息删除；

当所述目标分组的总存储量小于待存入的文件信息总的占用的存储量时，按所述步骤3中确定目标分组的方法重新确定存储无法存入所述目标分组的文件信息的目标分组。
如权利要求1所述的方法，其中，

所述方法还包括：按预设的时间周期定时检查文件存储区内是否存在损坏的文件，如果存在损坏的文件，则根据预设的算法，利用所述校验块将所述损坏的文件的原始数据恢复。
如权利要求6所述的方法，其中，

所述按预设的时间周期定时检查文件存储区内是否存在损坏的文件包括：按预设的时间周期定时地根据所述文件存储区内所有的文件的原始数据计算对应的文件标识，如果计算得到的所述文件标识与存储的文件标识不一致，则判断此文件损坏。
如权利要求1所述的方法，其中，

所述方法还包括：接收客户端发送的文件下载请求，所述文件下载请求包括待下载文件的文件标识，在所述文件标识范围涵盖所述待下载文件的文件标识的分组中查找与所述待下载文件的文件标识相同的文件标识，如果不存在与所述待下载文件的文件标识相同的文件标识，则在其余的所述分组中查找与所述待下载文件的文件标识相同的文件标识，将与所述待下载文件的文件标识相同的文件标识对应的文件的原始数据发送至客户端。
如权利要求1所述的方法，其中，

所述方法还包括：接收客户端发送的文件删除请求，所述文件删除请求包括待删除文件的文件标识，在所述文件标识范围涵盖所述待删除文件的文件标识的分组中查找与所述待删除文件的文件标识相同的文件标识，如果不存在与所述待删除文件的文件标识相同的文件标识，则在其余的所述分组中查找与所述待删除文件的文件标识相同的文件标识，将与所述待删除文件的文件标识相同的文件标识对应的文件信息删除，记录删除的文件属性，所述文件属性包括所述文件标识，还包括但不限于以下信息中至少一种：文件名、文件删除时间、文件上传时间和文件存储地址。
如权利要求1-9中任一项所述的方法，其中，

所述文件标识为利用预设的加密算法对文件原始数据进行计算得到的文件的唯一标识。
一种数据存储的装置，包括：

分组模块，设置为对文件存储区域进行分组，设置每个分组的存储容量；

上传请求接收模块，设置为接收客户端发送的文件上传请求，所述文件上传请求包括待上传文件的文件标识和根据预设算法计算出的所述待上传文件的校验块；

文件信息确定模块，设置为确定所述待上传文件的信息，包括所述待上传文件的文件标识、所述待上传文件的原始数据和所述校验块；

目标分组确定模块，设置为确定目标分组，包括：确定各分组的文件标识范围，根据所述待上传文件的文件标识和各分组的文件标识范围，将文件标识范围包含所述待上传文件的文件标识的分组并且剩余存储量不小于待上传文件信息占用的存储量的分组作为目标分组；

上传文件管理模块，设置为将所述待上传文件的信息存储至所述目标分组。
如权利要求11所述的装置，其中，

所述目标分组确定模块包括文件标识范围确定单元，用于确定各分组中包含的所有文件标识的涵盖范围，未存入任何信息的分组的文件标识范围和只存入一个文件标识的分组的文件标识范围为最大范围。
如权利要求12所述的装置，其中，

所述目标分组确定模块，还设置为在所述文件标识范围不是所述最大范围的分组中，各分组的所述文件标识范围均不涵盖所述待上传文件的文件标识，或者只有一个分组内的所述文件标识范围涵盖所述待上传文件的文件标识且该分组的剩余存储量小于所述待上传文件信息占用的存储量，则将已存储文件信息且剩余存储量不小于所述待上传文件信息占用的存储量的分组作为所述目标分组；

如果已存储文件信息的每个分组的剩余存储量均小于所述待上传文件信息占用的存储量，则将未存储文件信息的分组作为所述目标分组。
如权利要求12所述的装置，其中，

所述目标分组确定模块，还设置为在所述分组中有多个分组中的文件标识范围均涵盖所述待上传文件的文件标识且不是所述最大范围且所述多个分组中的每一个的剩余存储量均小于所述待上传文件信息占用的存储量时，新建与此多个分组的总数量相同的新的分组，将原多个分组中已存储的各文件和待上传文件按文件标识依次排序后确定待上传文件的位置所对应的分组，将此分组作为目标分组，并原多个分组中已存储的各文件存储到新的分组，删除原多个分组。
如权利要求14所述的装置，其中，

所述上传文件管理模块，还设置为当将多个分组中的文件信息和所述待上传文件的文件信息一起存入多个目标分组时，将待存入所述多个目标分组的文件信息根据预设的文件标识的排序方式依次存入所述多个目标分组中，将所述多个分组中存储的文件信息删除；

当所述目标分组的总存储量小于待存入的文件信息总的占用的存储量时，目标分组确定模块重新确定存储无法存入所述目标分组的文件信息的目标分组。
如权利要求11所述的装置，其中，

所述装置还包括检查模块，设置为按预设的时间周期定时检查文件存储区内是否存在损坏的文件，如果存在损坏的文件，则根据预设的算法，利用所述校验块将所述损坏的文件的原始数据恢复。
如权利要求16所述的装置，其中，

所述检查模块包括计算单元，设置为按预设的时间周期定时地根据所述文件存储区内所有的文件的原始数据计算对应的文件标识，如果计算得到的所述文件标识与存储的文件标识不一致，则判断此文件损坏。
如权利要求11所述的装置，其中，

所述装置还包括下载管理模块，设置为接收客户端发送的文件下载请求，所述文件下载请求包括待下载文件的文件标识，在所述文件标识范围涵盖所述待下载文件的文件标识的分组中查找与所述待下载文件的文件标识相同的文件标识，如果不存在与所述待下载文件的文件标识相同的文件标识，则在其余的所述分组中查找与所述待下载文件的文件标识相同的文件标识，将与所述待下载文件的文件标识相同的文件标识对应的文件的原始数据发送至客户端。
如权利要求11所述的装置，其中，

所述装置还包括删除管理模块，设置为接收客户端发送的文件删除请求，所述文件删除请求包括待删除文件的文件标识，在所述文件标识范围涵盖所述待删除文件的文件标识的分组中查找与所述待删除文件的文件标识相同的文件标识，如果不存在与所述待删除文件的文件标识相同的文件标识，则在其余的所述分组中查找与所述待删除文件的文件标识相同的文件标识，将与所述待删除文件的文件标识相同的文件标识对应的文件信息删除，记录删除的文件属性，所述文件属性包括所述文件标识，还包括但不限于以下信息中至少一种：文件名、文件删除时间、文件上传时间和文件存储地址。
如权利要求11-19中任一项所述的装置，其中，

所述文件标识为利用预设的加密算法对文件原始数据进行计算得到的文件的唯一标识。
一种计算机可读存储介质，所述存储介质上存储有计算机程序，所述程序被处理器执行时实现权利要求1至10中任意一项所述方法的步骤。
一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至10中任意一项所述方法的步骤。