WO2016045641A2

WO2016045641A2 - 数据块储存方法、数据查询方法和数据修改方法

Info

Publication number: WO2016045641A2
Application number: PCT/CN2015/090993
Authority: WO
Inventors: 周海燕
Original assignee: 北京古盘创世科技发展有限公司
Priority date: 2014-09-28
Filing date: 2015-09-28
Publication date: 2016-03-31
Also published as: US10521144B2; EP3200094A2; CN105528347B; EP3200094A4; WO2016045641A3; US20170242620A1; CN105528347A

Abstract

本发明涉及数据控制领域，具体而言，涉及数据块储存方法、数据查询方法和数据修改方法。该数据块储存方法，通过将待储存的数据块的文件内容进行拆分，以生成至少两个已拆分数据块的文件内容，其中，待拆分数据块的文件内容包括至少一个字符组，字符组是待拆分数据块的文件内容表示其含义的最小单位，字符组包括多个字符，每个已拆分数据块的文件内容包括同一字符组的部分字符，也就使数据块表示其最小含义的单位被拆分，即使他人获得了拆分后的一部分数据内容，也无法解析出有效的内，并且将拆分后的文件内容储存到了至少两个独立存储系统中，进而提高了数据的安全性，从而解决了现有技术中的不足。

Description

数据块储存方法、数据查询方法和数据修改方法

技术领域

本发明涉及数据控制领域，具体而言，涉及数据块储存方法、数据查询方法和数据修改方法。

背景技术

随着互联网技术的不断发展，目前基于各种云架构的产品层出不穷，云存储技术的载体是云端系统，具体的，云端系统包括公有云和私有云。私有云安全但不便于大规模调用，公有云的安全性从实际上和心理上都感觉会弱一些，但各种运算资源、存储资源和带宽资源都相对好的多。因此，很多用户都面临要将自己的数据存入公共网络而又面临安全问题的窘境。

比如现在的视频、音频、文本、邮件和图片等数据，很多都是个人或公共机构的私有数据，如果单一地放在一家服务提供商，不管提供商如何加密，用户都认为是脱离了自己的控制范围，造成心理上的不安全感，目前全球采用的主要技术都是通过自身的加密手段将用户的数据保存加密，再进行存放。

可以预知的是，通过获取加密密码，或者使用暴力破解工具来反向计算出解密密码，便可以从储存在云端系统，或其他储存系统里的数据中获取想要得到的明文信息，以直接读取。其中，数据块作为数据的主要载体，如果数据块的文件内容被恶意获取，则很容易发生泄密的问题。由此，需要出现一个方法，以解决云存储环境中的数据块的安全问题。

发明内容

本发明的目的在于提供数据块储存方法、数据查询方法和数据修改方法，以解决上述的问题。

在本发明的实施例中提供了数据块储存方法，其包括：

获取待拆分数据块，待拆分数据块包括表示其实际含义的文件内容；

按照预设的第一拆分规则对待拆分数据块的文件内容进行拆分，以生成至少两个已拆分数据块的文件内容，待拆分数据块的文件内容包括至少一个字符组，字符组是待拆分数据块的文件内容表示其含义的最小单位，字符组包括多个字符，每个已拆分数据块的文件内容包括同一字符组的部分字符；

分别将不同的已拆分数据块的文件内容按照预设的首次储存位置，储存至至少两个独立存储系统中。

优选的，在本发明的实施例中提供了数据块储存方法还包括：

按照预设的分割方式，将待拆分数据块分割为多个待拆分子数据块，使每个待拆分子数据块的文件内容与待拆分数据块的部分连续文件内容完全相同；

按照预设的第一拆分规则对待拆分数据块的文件内容进行拆分包括：

按照数据块拆分规则，分别对每个待拆分子数据块的文件内容进行拆分，以生成多个已拆分数据块。

优选的，待拆分数据块还包括表示其文件结构的文件头；

在获取待拆分数据块后还包括：按照预设的第二拆分规则对待拆分数据块的文件头进行拆分，以生成至少两个已拆分数据块的文件头，待拆分数据块的文件头包括至少一个字符组，字符组是待拆分数据块的文件头表示其含义的最小单位，字符组包括多个字符，每个已拆分数据块的文件头包括同一字符组的部分字符，或每个已拆分数据块的文件头包括待拆分数据块的文件头的部分字符组；

分别将不同的已拆分数据块的文件头按照预设的首次储存位置，储存至至少两个独立存储系统中。

优选的，按照预设的第二拆分规则对待拆分数据块的文件头进行拆分，以生成至少两个已拆分数据块的文件头包括：

获取文件头中表示文件结构的结构编码和文件内容的索引表，结构编码用于形成文件内容的框架，使文件内容能按照该框架进行填充，以形成能够直接显示的文件形式；

按照预设的第三拆分规则分别对结构编码和索引表进行拆分，以生成多个区域文件结构编码和与每个区域文件结构编码相对应的多个区域文件的索引表，每个区域文件结构编码和每个区域文件的索引表均与一个待拆分子数据块相对应，且每个区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件，每个区域文件的索引表携带有指定的一个待拆分子数据块的文件内容索引信息；

按照预设的第四拆分规则，分别对每个区域文件结构编码的代码和每个区域文件的索引表的代码进行拆分，以形成多个子区域文件结构编码和多个子区域文件的索引表，使每个子区域文件结构编码无法显示与其对应的区域文件结构编码的内容，且使每个子区域文件的索引表无法显示与其对应的区域文件的索引表的内容，多个子区域文件结构编码和多个子区域文件的索引表分别携带在至少两个已拆分数据块的文件头内。

优选的，若待拆分数据块的文件内容的字符组只包括定长字符串，且待拆分数据块的文件内容的字符组中字符总量能被Y整除，其中Y为定值，则根据第一拆分规则中所携带的分组数量X和拆分长度Y，依次对待拆分数据块中文件内容的定长字符串进行拆分，以生成X个已拆分数据块的文件内容，每个已拆分数据块的文件内容包括一个，或多个长度为Y的字符串。

优选的，根据第一拆分规则中所携带的分组数量X和拆分长度Y对文件内容的字符组为定长字符串进行拆分包括：

将待拆分数据块的文件内容的全部字符，按照排列的先后顺序，拆分为多组长度为Y的第一字符群；按照第一字符群的前后顺序，将多个第一字符群依次分配到X个已拆分数据块的文件内容中。

优选的，若待拆分数据块的文件内容的字符组只包括定长字符串，且待拆分数据块的文件内容的字符组中字符总量不能被Y整除，其中Y为定值，则使用填充数字对待拆分数据块的文件内容的字符组进行填充，使填充后的待拆分数据块的文件内容的字符组中字符总量能被Y整除；

根据第一拆分规则中所携带的分组数量X和拆分长度Y对待拆分数据块的文件内容的字符组为定长字符串进行拆分，以生成X个已拆分数据块的文件内容，每个已拆分数据块的文件内容包括一个，或多个长度为Y的字符串。

优选的，若待拆分数据块的文件内容的字符组只包括定长字符串，且待拆分数据块的文件内容的字符组中字符总量不能被Y整除，其中拆分长度Y为变量，则将待拆分数据块的文件内容的全部字符，按照排列的先后顺序，依次拆分为多组长度为按照Y变化的第二字符群；

按照第二字符群的前后顺序，依次将每组第二字符群分配到X个已拆分数据块的文件内容中。

优选的，依次拆分为多组长度为按照Y变化的第二字符群包括：

按照Y的一个变化值，连续拆分出X组字符长度相等的字符群。

优选的，还包括：随机获取多个函数值；

分别对每个函数值进行函数运算，以生成多个待使用值，函数运算包括三角函数运算、指对函数运算；

将每个待使用值进行取整运算，以确定变量Y。

优选的，若待拆分数据块的文件内容的字符组包括变长字符串，则将待拆分数据块的文件内容的字符组中变长字符串和定长字符串分为两组字符串组；

若定长字符串组中字符总量能被拆分长度Y整除，则根据第一拆分规则中所携带的分组数量X和拆分长度Y，对待拆分数据块中文件内容的定长字符串进行拆分，以生成X个已拆分数据块的文件内容，每个已拆分数据块的文件内容包括一个，或多个长度为Y的字符串；

确认变长字符串组的字符长度，并根据该字符长度进行拆分，以生成多个已拆分变长字符串组，多个已拆分变长字符串组依次分配到X个已拆分数据块的文件内容中。

优选的，若待拆分数据块为文本格式，则每个区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件包括：每个区域文件结构编码与相应的待拆分子数据块能组合成指定字数的连续文段；

若待拆分数据块为视频格式，则每个区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件包括：每个区域文件结构编码与相应的待拆分子数据块能组合成指定时间长度的连续视频影像；

若待拆分数据块为音频格式，则每个区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件包括：每个区域文件结构编码与相应的待拆分子数据块能组合成指定时间长度的连续音频数据；

若待拆分数据块为图像格式，则每个区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件包括：每个区域文件结构编码与相应的待拆分子数据块能组合成指定的连续图像。

优选的，分别将不同的已拆分数据块的文件内容按照预设的首次储存位置，储存至至少两个独立存储系统中包括：

将多个已拆分数据块的文件内容按照预定的储存比例储存至不同的公有储存系统，和/或私有储存系统中。

优选的，分别将不同的已拆分数据块的文件头按照预设的首次储存位置，储存至至少两个独立存储系统中包括：

将多个已拆分数据块的文件头按照预定的储存比例储存至不同的公有储存系统，和/或私有储存系统中，且已拆分数据块的文件头与已拆分数据块的文件内容的储存位置不同。

本发明实施例还提供了数据查询方法，包括数据块储存方法，还包括：

获取文件内容关键字；

在独立储存系统中查询与所述文件内容关键字相对应的多个已拆分数据块的文件内容；

根据预设的第一拆分规则将多个已拆分数据块的文件内容组成待拆分数据块的文件内容，或部分待拆分数据块的文件内容。

优选的，本发明实施例还提供的数据查询方法还包括，获取与已拆分数据块的文件内容关键字相对应的文件头关键字；

在云端系统中查询包含所述文件头关键字的多个已拆分数据块的文件头；

根据预设的第二拆分规则将多个已拆分数据块的文件头组成待拆分数据块的文件头；

将待拆分数据块的文件内容，或部分待拆分数据块的文件内容与待拆分数据块的文件头组成待拆分数据块，或部分待拆分数据块。

优选的，文件头中表示文件结构的结构编码和文件内容的索引表，结构编码用于形成文件内容的框架，使文件内容能按照该框架进行填充，以形成能够直接显示的文件形式；

根据预设的第二拆分规则将多个已拆分数据块的文件头组成待拆分数据块的文件头包括：

获取多个已拆分数据块的多个区域文件结构编码和多个区域文件的索引表；

按照预设的第三拆分规则分别对多个区域文件结构编码和多个区域文件的索引表进行组合，以形成待拆分数据块的文件头。

优选的，本发明实施例还提供的数据查询方法还包括：获取隐含数据代码，隐含数据代码用于在数据块中标识隐含文件；

按照预设的隐含数据代码拆分规则对隐含数据代码进行拆分，以获得至少两个已拆分隐含数据代码；

在云端系统中查询包含隐含数据代码的多个已拆分数据块的文件内容；

根据预设的第一拆分规则将多个已拆分隐含数据代码所对应的已拆分数据块的文件内容组成待拆分数据块的文件内容，或部分待拆分数据块的文件内容。

本发明实施例另提供了数据修改方法，包括数据块储存方法，还包括：

获取待写入字符串、写入位置和写入方式，写入方式包括删除、增加和替换；

根据写入位置和预先获取的首次储存位置，在独立的储存系统中查找待修改的数据块，首次储存位置包括每个已拆分数据块的文件内容的储存地址；

若写入方式为删除，则按照写入位置和第一拆分规则，将待修改的数据块中与写入位置相对应的字符删除，以生成已修改数据块的文件内容；

若写入方式为增加或替换，则将待写入字符串按照第一拆分规则进行拆分，以生成待写入字符；

将已拆分数据块的文件内容中与写入位置相对应的字符删除，并将待写入字符按照写入位置加入待修改的新数据块的文件内容，以生成多个已修改数据块的文件内容。

本发明实施例提供的数据块储存方法，与现有技术中的只通过对待储存的数据进行加密，导致他人可以使用反向破解的方式来得到解密密码，从而获取到原始的带出存数据，也就导致了数据处于不安全的状态相比，其通过将待储存的数据块的文件内容进行拆分，以生成至少两个已拆分数据块的文件内容，其中，待拆分数据块的文件内容包括至少一个字符组，字符组是待拆分数据块的文件内容表示其含义的最小单位，字符组包括多个字符，每个已拆分数据块的文件内容包括同一字符组的部分字符，也就使数据块表示其最小含义的单位被拆分，即使他人获得了拆分后的一部分数据内容，也无法解析出有效的内，并且将拆分后的文件内容储存到了至少两个独立存储系统中，进而提高了数据的安全性，从而解决了现有技术中的不足。

附图说明

图1示出了本发明实施例的数据块储存方法的基本流程图；

图2示出了本发明实施例的数据查询方法的基本流程图。

具体实施方式

下面通过具体的实施例子并结合附图对本发明做进一步的详细描述。

本发明实施例1提供了数据块储存方法，如图1所示，其包括如下步骤：

S101，获取待拆分数据块，待拆分数据块包括表示其实际含义的文件内容；

S102，按照预设的第一拆分规则对待拆分数据块的文件内容进行拆分，以生成至少两个已拆分数据块的文件内容；

S103，分别将不同的已拆分数据块的文件内容按照预设的首次储存位置，储存至至少两个独立存储系统中。

步骤S101中，数据块是指一组按顺序连续排列在一起的几组记录，是主存储器与输入、输出设备或外存储器之间进行传输的一个数据单位。数据块由2部分组成，分别是由文件头和文件内容。文件头中携带了数据架构的内容，而文件内容中携带了标识文件实际含义的数据内容。数据块作为数据的载体，通常的加密技术是对数据块中的文件数据进行调整，通过改变数据的表现形式来使读取数据的人无法了解到数据的真正含义，其中，改变数据表现形式的关键是加密秘钥，也就是通过加密秘钥的计算来改变数据的表现形式。但这种通过加密(包括对称加密和非对称加密)来加强数据安全性的方式，通常能够通过获取秘钥，或者其他的强行读取的方式来获取真实的数据，也就导致了泄密问题。有鉴于此，可以针对数据块的特性，分别将文件头和文件内容进行拆分，并储存，以提高安全性。也就是首先需要获取待拆分数据块的文件内容。具体获取文件内容的方式并不需要做限定，当然，为了提高处理的安全性，可以由指定的终端，或云端来获取，并对文件内容进行相应的拆分。

步骤S102中，待拆分数据块的文件内容包括至少一个字符组，字符组是待拆分数据块的文件内容表示其含义的最小单位，字符组包括多个字符，每个已拆分数据块的文件内容包括同一字符组的部分字符。其中，字符组是一组代码，该代码能够表示，或对应一个具有具体含义的释义单位。

如当文件内容所对应的是文字的话，那么，字符组所对应的含义应是文字的编码，即“我”字的编码为“11001110”，那么字符组也就是由8位的字符所组成。其他的音频、视频、图形、邮件等文件内容同样可以划分为这样的字符组，字符组中也需要固定的编码，作为计算机语言，其最小的语言单位便是二进制的0和1，因此，对字符组(一个字符组中的字符数量是可变的)进行拆分，能够使得文件内容无法表示其原有的含义。常见的文本格式(文件内容是文字)后缀有：PDF、DOC、TXT、WPS。

如果文件内容是音频的话，字符组所表示的含义便是某一时刻的发音，如该发音是由多个声音简单因复合而成，那么拆分的对应就应是每个单音，也就是需要对每个单音所对应的字符进行拆分，以使拆分后的字符无法对应上某具体发音。常见的音视频流媒体格式如：asf，Advanced Streaming format.(Microsoft)；rm，Real Video/Audio(Progressive Networks)；ra，Real Audio(Progressive，Networks)；swf，Shock Wave Flash(Macromedia)；mov，QuickTime(Apple)；viv，Vivo Movie(Vivo Software)；mp4，(Motion Picture Experts Group)；mp3，(Motion Picture Experts Group)。

如果文件内容是图像的话，字符组所表示的含义便是某一个像素点的像素代码，或者是某几个像素点代码的集合，且这个几个像素点共同出现不能够显示出图像的特征。其中，图像的特征是指图像所具有的某种，能够反映其含义的色彩区域的集合，如几个像素点的集合，那么在对这几个像素点进行拆分的时候，可以分别对这几个像素点的代码进行拆分(使每个像素点不能显示其原有的色彩)，也可以对这几个像素点进行整体的拆分(以生成足够零散的像素点的集合)，如拆分成互不相邻的几个像素点，这样，即使能够还原出这几个像素点，也无法根据这几个像素点来获知图像想要表达的真实含义。当然，在拆分为零散的几个像素点之后，还可以进一步对每个，或几个像素点的的代码进行拆分，以进一步提高安全性。

如果文件内容是视频的话，那么字符组所表示的含义便是某一时刻的图像，或某一时刻的图像的每个像素点。此时，视频某一时刻便是相对静止的画面(也就是每一帧图像)，那么这个相对静止的画面也就是一个图像，如此，便可以按照前文中对图像进行拆分的方式来对某一个画面的图像进行拆分。当然，不管是文字、音频、图像还是视频的文件内容均可以拆分成2个，或者多个文字文件内容(已拆分数据块的文件内容)，拆分出来的数据块文件内容越多，安全性越好，同样，将拆分后的文件内容进行组装的难度也就越大，组装的计算量也就越大。

将文件内容进行拆分后，便需要将文件进行储存，也就是执行步骤S103，为了提高文件内容的安全性，需要将拆分后的文件内容分别储存到不同的独立储存系统中，当然，储存的越零散，安全效果越好。如可以将拆分得到的文件内容A、B、C和D分别储存到A’、B’、C’和D’中，即使有人能够通过A’储存系统中获取到文件内容A，但无法获取其他的储存系统中的文件内容，同样不能了解到完整的文件内容所想要表达的真实含义。

在对文件进行储存后，每个储存系统都有一定发生故障的概率，如储存系统受到病毒的入侵，无法获取到被拆分后的文件内容；如储存系统中的文件内容均被删除，或者受到外力的破坏，均会导致外界无法获取到拆分后的文件内容。考虑到此，可以在储存的时候将拆分得到的N个文件内容储存到N+1个独立的储存系统中，并且，任意1个独立储存系统中的文件内容均可以在其他独立的储存系统中找到。

如，拆分得到A、B、C、D和E，5个已拆分数据块的文件内容(已拆分文件内容)，其中，任意三个已拆分文件内容组合后便能够还原出原数据块(待拆分数据块)，那么便可以在每个储存系统中最多储存两个已拆分文件内容，来防止某一个储存系统能够获得足够还原为待拆分数据块(待拆分文件内容)的足够数量的已拆分文件内容，如，将这5个已拆分文件内容分别储存在5个储存系统中，其储存方式可以是AB储存在一个储存系统中，BC储存在一个储存系统中，CD储存在一个储存系统中，DE储存在一个储存系统中，EA储存在一个储存系统中。当然，也可以在每个储存系统中储存三、四个已拆分文件内容，但某一个储存系统中储存的已拆分文件内容越多，文件的安全性也就越差，也就是单独的一个储存系统越容易还原出待拆分数据块，这样对数据安全不利，由此，可以将2-3个已拆分文件内容储存到独立的储存系统中。

进一步地，本发明所提供的数据块储存方法，还包括：如下步骤：

则步骤S102，按照预设的第一拆分规则对待拆分数据块的文件内容进行拆分包括：

对待拆分数据块进行拆分，生成多个待拆分子数据块也就是将待拆分子数据块拆分为几个段落，如将一篇文章拆分为数个连续的段落，或句群；将一段视频，或音频拆分为数个连续的时间段视频，或音频；将图画拆分为几个边界连续的区域。这样，在进行下一步拆分的时候，便可以以此为基础进行进一步的拆分工作。那么在需要对文件进行修改的时候，可以将已拆分数据块组合成待拆分子数据块，由于待拆分子数据块是具有连续的文件内容，那么待拆分子数据块也就能够还原数据的一部分，且这一部分是具有具体含义的，此时对这一部分数据进行修改即可，这要远比将全部的已拆分数据块组合成待拆分数据块的工作量要小。并且，当已拆分数据块全部储存在云端之后，如果想要对文件内容进行修改，就不需要将全部的已拆分数据块下载下来，而是只要将对应的某一部分已拆分数据块下载下来，组装后再修改；也可以组装后，再下载，进而进行修改。这样，在进行网络传输的时候，可以只传输原数据块(待拆分数据块)的一部分，这大大降低了数据的传输量，节约了网络资源。

除了对文件内容进行拆分，还可以对文件头进行拆分，也就是待拆分数据块还包括表示其文件结构的文件头；

步骤S101，在获取待拆分数据块后还包括：按照预设的第二拆分规则对待拆分数据块的文件头进行拆分，以生成至少两个已拆分数据块的文件头，待拆分数据块的文件头包括至少一个字符组，字符组是待拆分数据块的文件头表示其含义的最小单位，字符组包括多个字符，每个已拆分数据块的文件头包括同一字符组的部分字符，或每个已拆分数据块的文件头包括待拆分数据块的文件头的部分字符组；

对文件头进行的拆分可以如对文件内容进行的拆分方式进行。文件头中所携带的字符是表示文件结构的，除了按照文件内容的拆分和储存方式进行，还可以是将文件头按照字符组进行拆分，也就是拆分后的文件头可以包括完整的字符组。即待拆分的文件头包括有多个字符组，所有的字符组组合后能够形成完整的文件结构，那么，将文件头拆分成多个已拆分数据块的文件头，且已拆分数据块的文件头包括所述待拆分数据块的文件头的部分字符组，也就是已拆分数据块的文件头包括有一部分有具体含义的文件结构信息，但单纯了解这些信息，并不足以显示足够的内容，也就是不造成泄密的情况。而且，拆分后的文件头可以形成与待拆分子数据块相对应的文件结构，从而能够形成部分的文件信息(某一段音频、视频或某一部分图像)。

进一步，按照预设的第二拆分规则对待拆分数据块的文件头进行拆分，以生成至少两个已拆分数据块的文件头包括如下步骤：

S104，获取文件头中表示文件结构的结构编码和文件内容的索引表，结构编码用于形成文件内容的框架，使文件内容能按照该框架进行填充，以形成能够直接显示的文件形式；

S105，按照预设的第三拆分规则分别对结构编码和索引表进行拆分，以生成多个区域文件结构编码和与每个区域文件结构编码相对应的多个区域文件的索引表，每个区域文件结构编码和每个区域文件的索引表均与一个待拆分子数据块相对应，且每个区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件，每个区域文件的索引表携带有指定的一个待拆分子数据块的文件内容索引信息；

S106，按照预设的第四拆分规则，分别对每个区域文件结构编码的代码和每个区域文件的索引表的代码进行拆分，以形成多个子区域文件结构编码和多个子区域文件的索引表，使每个子区域文件结构编码无法显示与其对应的区域文件结构编码的内容，且使每个子区域文件的索引表无法显示与其对应的区域文件的索引表的内容，多个子区域文件结构编码和多个子区域文件的索引表分别携带在至少两个已拆分数据块的文件头内。

步骤S104中，结构编码和文件内容的索引表是两种对文件内容进行描述的内容，如索引表描述了指定的文件内容的出现位置，结构编码描述了文件的展现形式，如表格、阵列等，也就是结构编码和索引表通常是文件中，或者说是复杂文件中不可缺少的一部分，二者描述了文件的架构。

步骤S105中，与前文中，对待拆分数据块分解为多个待拆分子数据块相对应的，此处，将结构编码拆分为区域文件的结构编码和将索引表拆分为区域文件的索引表都是为了与待拆分子数据块相配合，使待拆分子数据块能够还原成一个完整的文件(也就是还原成一个完整的待拆分数据块的一部分，这一部分是连续的，如图片的某一部分，音频、视频的某一个时间段的文件、文字的某一个句子，或者句群)。

步骤S106中，需要对已经拆分过的区域文件的结构编码和区域文件的索引表再次进行拆分，以生成多个子区域文件结构编码和多个子区域文件的索引表。每个子区域文件结构编码和每个子区域文件的索引表无法表示真实含义，也就是即使读取到了一个子区域文件结构编码，或一个子区域文件的索引表，也无法知悉文件的架构体系。此步骤中，第四拆分规则是指对文件的代码进行拆分，也就是对一个子区域文件结构编码，或一个子区域文件的索引表的代码进行分解，这样便能够保证文件结构的安全性了。

在储存子区域文件结构编码和子区域文件的索引表时，可以分别对二者进行储存，以提高安全性。并且，在储存已拆分文件内容(已拆分文件内容)的时候，也可以分别子区域文件结构编码、子区域文件的索引表和已拆分文件内容分开进行储存，以提高安全性。在需要使用的时候，分别调取三者，以还原部分数据块(该部分数据块是能够还原出连续的文件内容)。当然，为了加强数据块的管理性，也可以将使部分数据块还原出的文件内容是非连续的，也就是离散的。

进一步地，若待拆分数据块的文件内容的字符组只包括定长字符串，且待拆分数据块的文件内容的字符组中字符总量能被Y整除，其中Y为定值，则根据第一拆分规则中所携带的分组数量X和拆分长度Y，依次对待拆分数据块中文件内容的定长字符串进行拆分，以生成X个已拆分数据块的文件内容，每个已拆分数据块的文件内容包括一个，或多个长度为Y的字符串。

大部分的字符串都是定长的字符串，也就是字符串的长度不会随存储位置的改变，或者存储形式的改变而发生变化。那么便可以通过设定拆分长度Y，来确定要将全部字符拆分为多少个长度为Y的部分。在确定了分组数量X和拆分长度Y之后，便可以针对性的进行拆分，具体的，可以将全部字符现分为多个长度为Y的字符群，再依次将每一个字符群，放置到对应的分组中。如，可以对每个字符群进行标号，标识的号码就是1-X，也就是标识了每个字符群的代码，再标识了每个字符群的代码之后，便可以将每个字符群放置到其对应的代码的分组中。如数组字符如下：01010010，00001001，01010100，10100101，01010101，00101011，01001010，10011111，00101001，10100100，01010010，01011001。其中设X为2，Y为8，那么可以将多个字符群拆分为两组：

X1＝01010010，01010100，01010101，01001010，00101001，01010010；

X2＝00001001，10100101，00101011，10011111，10100100，01011001；如将X设为3，Y为16，也就可以拆分为3组，

X1＝01010010，00001001，01001010，10011111；

X2＝01010100，10100101，00101001，10100100；

X3＝01010101，00101011，01010010，01011001；

同样的，将X设为任意一个小于字符总量的数字均可，Y可以设置为能够被字符总量整除的数字即可(如X＝9，Y＝2；X＝5，Y＝4)。当然，为了提高保密性，Y最好不要设置为1，或者设置为与字符总量相等的数字。

也可以在对字符群标识的时候打乱标识的顺序，如隔位标识，或者奇偶位的标识方式不同，以提高安全性。

在拆分的时候，可以按照顺序的方式进行拆分，也就是，根据第一拆分规则中所携带的分组数量X和拆分长度Y对文件内容的字符组为定长字符串进行拆分包括：

除了字符总量能够被Y整除的情况，还有字符总量不能被Y整除的情况，对于具体计算而言，也就是字符总量除以Y的余数不为零。也就是如下这种情况：若待拆分数据块的文件内容的字符组只包括定长字符串，且待拆分数据块的文件内容的字符组中字符总量不能被Y整除，其中Y为定值，则使用填充数字对待拆分数据块的文件内容的字符组进行填充，使填充后的待拆分数据块的文件内容的字符组中字符总量能被Y整除；

也就是先对字符组中的字符进行填充，使填充后的字符数量能够被Y整除，其中，填充的字符可以是预设的无实际含义的字符。

若待拆分数据块的文件内容的字符组只包括定长字符串，且待拆分数据块的文件内容的字符组中字符总量不能被Y整除，其中拆分长度Y为变量，则将待拆分数据块的文件内容的全部字符，按照排列的先后顺序，依次拆分为多组长度为按照Y变化的第二字符群；

也就是Y的值是一个变化值，这样每次分出来的字符群的长度均可以是不相同，那么在组装这些字符群的时候，也就需要知悉Y的变化规律，这样又进一步加强了安全性。

除了将字符群按照先后顺序进行拆分，还能够将字符群进行隔位拆分，如某字的编码是D4C6 4E91 E4 BA 91，那么，可以将该字符串的按照其奇偶数位的顺序进行拆分。如D4C6拆分为DC和C6，将4E91拆分为49和E1，将E4BA91拆分为EB9和4A1，如此各位拆分也同样能够起到隐含原字符所对应含义的作用。进一步，除了上述提及的隔位拆分，还可以是按照预先设定的顺序进行拆分，如取每个字符串的首尾字符，D4C6 4E91 E4 BA 91取得首尾字符也就是D(首字符)和1(尾字符)，那么拆分出来的两个组合就是D1和4C6 4E91 E4 BA 9。还可以是按照一定的数学规则进行拆分，如，按照斐波那契数列进行拆分，也就是取得一组字符串中1、1、2、3、5、8、13、21位置的数字，并且留下其他的数字，以将原字符串区分为两组子字符串，这种预先设定的顺序可以是关联方式中的一部分。如Y的值为2，4，6，8，10…也就是Y的取值，每次要增加2，那么对于如下的字符群可以如此的划分：00001111，00001111，11110000，1111000划分为，00，0011，110000，11111111，0000111100，00…可通过如此的方式来增加拆分后的数据安全性。进一步，依次拆分为多组长度为按照Y变化的第二字符群包括：

在按照Y的变化值进行拆分的基础上，为了保证分配给每个分组的字符群的字符数量是相等的，也就可以按照Y的一个变化值，连续拆分多次(X次)，如123456789098765432，这18数字可以按照Y＝2，1，3拆分为3组(X＝3)。那么，先将这18个数字分为9组，分别是12，34，56，7，8，9，098，765，432，再将这几组数字分别分配给三个分组，X1＝12，7，098；X2＝34，8，765；X3＝56，9，432。这样的拆分方式能够保证每个分组所得到的数量均是相同的，也就是对每组分的字符进行储存的时候，所需要的储存空间均是相同的，可以更加合理的分配储存空间，以提高读取和储存的效率，并且在计算机内部进行更新的时候提高效率。

需要说明的是，为了便于确定数据块的储存位置，可以将表示含义相同的字符串，以同样的方式进行拆分，这样可以减少工足量，也便于将已拆分数据块进行组合。

除了预先生成多个Y值，并且将生成的多个Y值作为随机变量，还可以通过函数运算来确定每次，Y的变化值，如本发明所提供的数据块储存方法还包括如下步骤：

随机获取多个函数值；

将每个待使用值进行取整运算，以确定变量Y。

三角函数运算和指对函数运算如，Sin A＝Y(A大于0度小于90度，不等于30度，)，

Cos A＝Y(A大于0度小于90度，不等于60度)；

Tan A＝Y(A大于0度小于90度，不等于45度)；

Log 以A为底的C的对数＝Y(C大于0，不等于1，C不能为A的倍数)；

In A＝Y(A不等于1，不等于e)；

A开N次方＝Y。其中，不同的数字计算出的结果可能是小数，这样便需要将小数取整，取整可以按照向上取整，或者向下取整，或者四舍五入的方式进行。

除了定长的字符组，还有变长的字符组，如UTF-8，若待拆分数据块的文件内容的字符组包括变长字符串，则将待拆分数据块的文件内容的字符组中变长字符串和定长字符串分为两组字符串组；

如果定长字符串组的字符长度无法被Y整除，那么可以按照前文中的方式，使用添加字符，将其字符串组的长度添加至能够被Y正常的长度，再进行分组。

进一步地，若待拆分数据块为文本格式，则每个区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件包括：每个区域文件结构编码与相应的待拆分子数据块能组合成指定字数的连续文段；

也就是每一个待拆分子数据块均有其固定的含义，能够表达一定的内容，那么在使用者想要修改数据块的内容时，不需要将已经拆分过的数据块全部组合、还原，只需要将一部分还原成待拆分子数据块即可。大大节省了数据处理的数量，并且，如果拆分后的数据块是存储在网络数据库(云端数据库)中，那么终端想要获取云端数据库中的内容的话，也可以指获取少部分的文件内容，进而对这少部分的文件内容进行修改，在保证修改符合要求的情况下，可以大大降低网络传输数据的数量。

除了对数据块进行拆分，还可以通过对数据块改变储存位置来提高安全性，分别将不同的已拆分数据块的文件内容按照预设的首次储存位置，储存至至少两个独立存储系统中包括：

通过将数据储存到不同的储存系统中，也能够起到提高安全性的效果。还可以将不同的已拆分数据块储存到不同的云端系统中，以进一步提高安全性。

还可以是，分别将不同的已拆分数据块的文件头按照预设的首次储存位置，储存至至少两个独立存储系统中包括：

并且，需要说明的是，私有储存系统的安全性高，但接入的便捷性较差，相对的，公有储存系统的安全性低，但接入的便捷性较快，因此，可以根据待拆分的数据块的性质(强调安全性，还是强调接入、读取数据块的便捷性)，来选择在公有储存系统，或私有储存系统的储存比例。其中，较好的是将多个已拆分数据块存储在至少一个公有储存系统中和至少一个私有储存系统中。当然，可以根据使用者的需求的不同(要求数据块具有更高的安全性，还是更好的可读取性)可以将多个已拆分数据块中的一部分储存在公有储存系统(可以是分别储存到多个公有储存系统中，以提高新数据块(已拆分数据块)的安全性)，并将另几个新数据块储存在私有储存系统(可以是分别储存到多个私有储存系统中，以提高新数据块的安全性)，储存在公有储存系统和私有储存系统中的全部已拆分数据块组合后，才能够还原为待拆分数据块(原数据块)；也可以是多个已拆分数据块中的一部分组合后，才能够还原为原数据块表，其中这一部分(多个已拆分数据块中的部分数据块)也需要分别储存在至少一个公有储存系统和一个私有储存系统中。如可以按照公有储存系统：私有储存系统＝3:7的方式对多个已拆分数据块进行储存。

本发明实施例提供的数据块储存方法，与现有技术中的只通过对待储存的数据进行加密，导致他人可以使用反向破解的方式来得到解密密码，从而获取到原始的带出存数据，也就导致了数据处于不安全的状态相比，其通过将待储存的数据块的文件内容进行拆分，以生成至少两个已拆分数据块的文件内容，其中，待拆分数据块的文件内容包括至少一个字符组，字符组是待拆分数据块的文件内容表示其含义的最小单位，字符组包括多个字符，每个已拆分数据块的文件内容包括同一字符组的部分字符，也就使数据块表示其最小含义的单位被拆分，即使他人获得了拆分后的一部分数据内容，也无法解析出有效的内，并且将拆分后的文件内容储存到了至少两个独立存储系统中，进而提高了数据的安全性，并且通过对文件头中的结构编码和索引表分别进行拆分和存储，还通过改变公有储存系统和私有储存系统中的储存比例，从而更好的解决了现有技术中的不足。

本发明实施例2提供了数据查询方法，实施例1所提供的数据块储存方法，在对已拆分数据块进行储存后还包括如下步骤，如图2所示：

S201，获取文件内容关键字；

S202，在独立储存系统中查询与所述文件内容关键字相对应的多个已拆分数据块的文件内容；

S203，根据预设的第一拆分规则将多个已拆分数据块的文件内容组成待拆分数据块的文件内容，或部分待拆分数据块的文件内容。

步骤S201中，关键字是一个已经被拆分好的文件内容，或者文件头，这可以是在实施例所提供的数据块储存方法，执行的过程中记录下来的，如果拆分后终端取得某个具有标示性作用的字符，或者执行拆分动作的时候，对拆分得到的已拆分数据块进行标识，以确定关键字所对应的哪个已拆分数据块。这样，便能够确定需要查询的数据块是哪个了。

步骤S202中，对关键字进行拆分是将关键字按照第一拆分规则进行拆分(如果每种字符串的拆分规则是相同的)，以确定关键字所对应的已拆分数据块。

步骤S203中，按照拆分的方式将获取到的已拆分数据块还原即可，还原的可以是全部的原数据块，也可以是部分的原数据块。

进一步地，本发明实施例2提供了数据查询方法还包括，获取与已拆分数据块的文件内容关键字相对应的文件头关键字；

在云端系统中查询包含文件头关键字的多个已拆分数据块的文件头；

进一步地，文件头中表示文件结构的结构编码和文件内容的索引表，结构编码用于形成文件内容的框架，使文件内容能按照该框架进行填充，以形成能够直接显示的文件形式；

进一步地，本发明所提供的数据查询方法，其还包括：获取隐含数据代码，隐含数据代码用于在数据块中标识隐含文件；

本发明实施例3提供了数据修改方法，包括实施例1的数据块储存方法，其还包括：

其中，修改的方式，可以是先将修改的内容独立储存，再在确认修改后，添加到指定的位置。指定的位置可以是两个字符之间，或者某两个段落之间等。

显然，本领域的技术人员应该明白，上述的本发明的各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。软件类发明可有这段话，否则删除。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种数据块储存方法，其特征在于，包括：

获取待拆分数据块，所述待拆分数据块包括表示其实际含义的文件内容；

按照预设的第一拆分规则对所述待拆分数据块的文件内容进行拆分，以生成至少两个已拆分数据块的文件内容，所述待拆分数据块的文件内容包括至少一个字符组，所述字符组是所述待拆分数据块的文件内容表示其含义的最小单位，所述字符组包括多个字符，每个所述已拆分数据块的文件内容包括同一字符组的部分所述字符；

分别将不同的所述已拆分数据块的文件内容按照预设的首次储存位置，储存至至少两个独立存储系统中。
根据权利要求1所述的数据块储存方法，其特征在于，还包括：

按照预设的分割方式，将所述待拆分数据块分割为多个待拆分子数据块，使每个所述待拆分子数据块的文件内容与所述待拆分数据块的部分连续文件内容完全相同；

所述按照预设的第一拆分规则对所述待拆分数据块的文件内容进行拆分包括：

按照数据块拆分规则，分别对每个所述待拆分子数据块的文件内容进行拆分，以生成多个已拆分数据块。
根据权利要求2所述的数据块储存方法，其特征在于，所述待拆分数据块还包括表示其文件结构的文件头；

在所述获取待拆分数据块后还包括：按照预设的第二拆分规则对所述待拆分数据块的文件头进行拆分，以生成至少两个已拆分数据块的文件头，所述待拆分数据块的文件头包括至少一个字符组，所述字符组是所述待拆分数据块的文件头表示其含义的最小单位，所述字符组包括多个字符，每个所述已拆分数据块的文件头包括同一字符组的部分所述字符，或每个所述已拆分数据块的文件头包括所述待拆分数据块的文件头的部分字符组；

分别将不同的所述已拆分数据块的文件头按照预设的首次储存位置，储存至至少两个独立存储系统中。
根据权利要求3所述的数据块储存方法，其特征在于，所述按照预设的第二拆分规则对所述待拆分数据块的文件头进行拆分，以生成至少两个已拆分数据块的文件头包括：

获取所述文件头中表示文件结构的结构编码和文件内容的索引表，所述结构编码用于形成所述文件内容的框架，使所述文件内容能按照该框架进行填充，以形成能够直接显示的文件形式；

按照预设的第三拆分规则分别对所述结构编码和所述索引表进行拆分，以生成多个区域文件结构编码和与每个区域文件结构编码相对应的多个区域文件的索引表，每个所述区域文件结构编码和每个区域文件的索引表均与一个所述待拆分子数据块相对应，且每个所述区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件，每个所述区域文件的索引表携带有指定的一个待拆分子数据块的文件内容索引信息；

按照预设的第四拆分规则，分别对每个所述区域文件结构编码的代码和每个区域文件的索引表的代码进行拆分，以形成多个子区域文件结构编码和多个子区域文件的索引表，使每个子区域文件结构编码无法显示与其对应的区域文件结构编码的内容，且使每个子区域文件的索引表无法显示与其对应的区域文件的索引表的内容，多个所述子区域文件结构编码和多个所述子区域文件的索引表分别携带在至少两个所述已拆分数据块的文件头内。
根据权利要求4所述的数据块储存方法，其特征在于，

若所述待拆分数据块的文件内容的字符组只包括定长字符串，且所述待拆分数据块的文件内容的字符组中字符总量能被Y整除，其中Y为定值，则根据所述第一拆分规则中所携带的分组数量X和拆分长度Y，依次对所述待拆分数据块中所述文件内容的定长字符串进行拆分，以生成X个已拆分数据块的文件内容，每个所述已拆分数据块的文件内容包括一个，或多个长度为Y的字符串。
根据权利要求5所述的数据块储存方法，其特征在于，所述根据所述第一拆分规则中所携带的分组数量X和拆分长度Y对所述文件内容的字符组为定长字符串进行拆分包括：

将所述待拆分数据块的文件内容的全部字符，按照排列的先后顺序，拆分为多组长度为Y的第一字符群；按照所述第一字符群的前后顺序，将多个第一字符群依次分配到X个已拆分数据块的文件内容中。
根据权利要求4所述的数据块储存方法，其特征在于，若所述待拆分数据块的文件内容的字符组只包括定长字符串，且所述待拆分数据块的文件内容的字符组中字符总量不能被Y整除，其中Y为定值，则使用填充数字对所述待拆分数据块的文件内容的字符组进行填充，使填充后的所述待拆分数据块的文件内容的字符组中字符总量能被Y整除；

根据所述第一拆分规则中所携带的分组数量X和拆分长度Y对所述待拆分数据块的所述文件内容的字符组为定长字符串进行拆分，以生成X个已拆分数据块的文件内容，每个所述已拆分数据块的文件内容包括一个，或多个长度为Y的字符串。
根据权利要求4所述的数据块储存方法，其特征在于，

若所述待拆分数据块的文件内容的字符组只包括定长字符串，且所述待拆分数据块的文件内容的字符组中字符总量不能被Y整除，其中拆分长度Y为变量，则将所述待拆分数据块的文件内容的全部字符，按照排列的先后顺序，依次拆分为多组长度为按照Y变化的第二字符群；

按照所述第二字符群的前后顺序，依次将每组第二字符群分配到X个已拆分数据块的文件内容中。
根据权利要求8所述的数据块储存方法，其特征在于，所述依次拆分为多组长度为按照Y变化的第二字符群包括：

按照Y的一个变化值，连续拆分出X组字符长度相等的字符群。
根据权利要求8所述的数据块储存方法，其特征在于，还包括：随机获取多个函数值；

分别对每个函数值进行函数运算，以生成多个待使用值，所述函数运算包括三角函数运算、指对函数运算；

将每个待使用值进行取整运算，以确定变量Y。
根据权利要求8所述的数据块储存方法，其特征在于，若所述待拆分数据块的文件内容的字符组包括变长字符串，则将所述待拆分数据块的文件内容的字符组中变长字符串和定长字符串分为两组字符串组；

若定长字符串组中字符总量能被拆分长度Y整除，则根据所述第一拆分规则中所携带的分组数量X和拆分长度Y，对所述待拆分数据块中所述文件内容的定长字符串进行拆分，以生成X个已拆分数据块的文件内容，每个所述已拆分数据块的文件内容包括一个，或多个长度为Y的字符串；

确认变长字符串组的字符长度，并根据该字符长度进行拆分，以生成多个已拆分变长字符串组，多个所述已拆分变长字符串组依次分配到X个已拆分数据块的文件内容中。
根据权利要求4所述的数据块储存方法，其特征在于，

若所述待拆分数据块为文本格式，则所述每个所述区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件包括：每个所述区域文件结构编码与相应的待拆分子数据块能组合成指定字数的连续文段；

若所述待拆分数据块为视频格式，则所述每个所述区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件包括：每个所述区域文件结构编码与相应的待拆分子数据块能组合成指定时间长度的连续视频影像；

若所述待拆分数据块为音频格式，则所述每个所述区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件包括：每个所述区域文件结构编码与相应的待拆分子数据块能组合成指定时间长度的连续音频数据；

若所述待拆分数据块为图像格式，则所述每个所述区域文件结构编码与相应的待拆分子数据块能组合成可直接显示的整体文件包括：每个所述区域文件结构编码与相应的待拆分子数据块能组合成指定的连续图像。
根据权利要求1所述的数据块储存方法，其特征在于，所述分别将不同的所述已拆分数据块的文件内容按照预设的首次储存位置，储存至至少两个独立存储系统中包括：

将多个所述已拆分数据块的文件内容按照预定的储存比例储存至不同的公有储存系统，和/或私有储存系统中。
根据权利要求3所述的数据块储存方法，其特征在于，所述分别将不同的所述已拆分数据块的文件头按照预设的首次储存位置，储存至至少两个独立存储系统中包括：

将多个所述已拆分数据块的文件头按照预定的储存比例储存至不同的公有储存系统，和/或私有储存系统中，且已拆分数据块的文件头与已拆分数据块的文件内容的储存位置不同。
一种数据查询方法，包括权利要求1至14中任一项所述的数据块储存方法，其特征在于，还包括：

获取文件内容关键字；

在独立储存系统中查询与所述文件内容关键字相对应的多个已拆分数据块的文件内容；

根据预设的所述第一拆分规则将多个所述已拆分数据块的文件内容组成待拆分数据块的文件内容，或部分待拆分数据块的文件内容。
根据权利要求15所述的数据查询方法，其特征在于，还包括，获取与所述已拆分数据块的文件内容关键字相对应的文件头关键字；

在云端系统中查询包含所述文件头关键字的多个已拆分数据块的文件头；

根据预设的所述第二拆分规则将多个所述已拆分数据块的文件头组成待拆分数据块的文件头；

将所述待拆分数据块的文件内容，或部分待拆分数据块的文件内容与所述待拆分数据块的文件头组成待拆分数据块，或部分待拆分数据块。
根据权利要求16所述的数据查询方法，其特征在于，

所述文件头中表示文件结构的结构编码和文件内容的索引表，所述结构编码用于形成所述文件内容的框架，使所述文件内容能按照该框架进行填充，以形成能够直接显示的文件形式；

所述根据预设的所述第二拆分规则将多个所述已拆分数据块的文件头组成待拆分数据块的文件头包括：

获取多个已拆分数据块的多个区域文件结构编码和多个区域文件的索引表；

按照预设的第三拆分规则分别对多个区域文件结构编码和多个区域文件的索引表进行组合，以形成待拆分数据块的文件头。
根据权利要求15所述的数据查询方法，其特征在于，还包括：获取隐含数据代码，所述隐含数据代码用于在数据块中标识隐含文件；

按照预设的隐含数据代码拆分规则对所述隐含数据代码进行拆分，以获得至少两个已拆分隐含数据代码；

在云端系统中查询包含所述隐含数据代码的多个已拆分数据块的文件内容；

根据预设的所述第一拆分规则将多个所述已拆分隐含数据代码所对应的已拆分数据块的文件内容组成待拆分数据块的文件内容，或部分待拆分数据块的文件内容。
一种数据修改方法，包括权利要求1至14任一项所述的数据块储存方法，其特征在于，还包括：

获取待写入字符串、写入位置和写入方式，所述写入方式包括删除、增加和替换；

根据所述写入位置和预先获取的首次储存位置，在独立的储存系统中查找待修改的数据块，所述首次储存位置包括每个所述已拆分数据块的文件内容的储存地址；

若所述写入方式为删除，则按照写入位置和所述第一拆分规则，将所述待修改的数据块中与所述写入位置相对应的字符删除，以生成已修改数据块的文件内容；

若所述写入方式为增加或替换，则将待写入字符串按照所述第一拆分规则进行拆分，以生成待写入字符；

将所述已拆分数据块的文件内容中与所述写入位置相对应的字符删除，并将所述待写入字符按照所述写入位置加入待修改的新数据块的文件内容，以生成多个已修改数据块的文件内容。