CN103248713A - 一种同步盘数据安全保护方法 - Google Patents
一种同步盘数据安全保护方法 Download PDFInfo
- Publication number
- CN103248713A CN103248713A CN2013102048104A CN201310204810A CN103248713A CN 103248713 A CN103248713 A CN 103248713A CN 2013102048104 A CN2013102048104 A CN 2013102048104A CN 201310204810 A CN201310204810 A CN 201310204810A CN 103248713 A CN103248713 A CN 103248713A
- Authority
- CN
- China
- Prior art keywords
- synchronous disk
- data
- file
- user
- protection method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Storage Device Security (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种同步盘数据安全保护方法,它实现了用户所存储文件的自组织与管理。用户文件以分块的形式分别存储在不同的同步盘之中,通过编码、加密、副本等机制来确保文件内容的安全性。本发明可有效解决用户数据在同步盘之上的隐私保护与可用性保障问题,同时还突破了特定同步盘的限制:如容量、文件类型、单个文件大小等。
Description
技术领域
本发明涉及云存储数据安全领域,具体涉及用户文件的自组织与管理、同步盘数据的写入和读取,该方法能够解决用户数据存储于同步盘之上的隐私保护和可用性保障问题,同时还可以打破单一同步盘的限制,如容量,文件类型、单个文件大小等。
背景技术
同步盘是一种云存储服务,它实现了文件从本地目录到云存储的自动同步,是用户进行数据网络备份的理想选择。目前国内的百度、360安全卫视、腾讯、金山、华为等知名IT厂商都已推出相应的同步盘服务。随着同步盘的普及,其安全性受到用户越来越多地关注,主要体现用户数据的隐私保护和可用性两个方面。相关调查表明,目前约70%的用户因为该原因而不愿使用云存储服务来存储关键数据。而伯克利白皮书中总结了云计算的十大问题与机会,其中服务可用性位列第一。
目前,解决以上安全问题主要有2种思路,具体分析如下。
第一种思路:从改造同步盘服务提供者的角度出发,增强其隐私保护能力。但是,退一步来说,即便服务提供方足够安全,但由于其作为数据实际控制者的身份,对用户来说,始终存在安全的顾虑;此外目前云存储处于高速发展阶段,尚未形成统一的行业标准,各个厂家采用的系统架构和技术路线差异很大,很难将第一种思路的解决方案统一应用到不同的实现机制中,在普适性上存在一定的问题;最后,在不改变现有系统的情况下,第一种思路的解决方案无法解决已有的成熟云存储系统的隐私保护和可用性问题。
第二种思路:从用户端角度出发,对数据进行预处理,例如通过加密来解决数据的隐私保护问题,通过备份或冗余编码来解决数据的可用性问题。由于不同的数据有不同的安全需求,例如有的注重隐私保护,而有的注重可用性;而数据的特性,如读写特性,访问特性,存储特性也各不相同,单一的方法无法满足所有的需求,目前,还尚未有一种统一的方法能将数据的安全需求和数据自身特点综合考虑,最终使得用户数据具有较高安全性。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种同步盘数据安全保护方法,它实现了用户所存储文件的自组织与管理,用户文件以分块的形式分别存储在不同的同步盘之中,通过编码、加密、副本等机制来确保文件内容的安全性。本发明可有效解决同步盘数据的隐私保护与可用性保障问题,同时还突破了特定同步盘的限制:如容量、文件类型、单个文件大小等。
本发明提供了一种同步盘数据安全保护的方法,具体描述如下。
1. 用户数据在写入同步盘之前,先确定分块策略,然后执行该策略,对该数据进行分块;
2. 用户数据分块之后,对分块数据进行变换处理,具体的处理机制包括:加密、压缩、纠删码编码、副本冗余、MD5计算等处理方法中的一种或多种组合;
3. 将变换处理的输出数据,依据“存储策略”进行处理,其数据的存储位置有以下几种:本地目录、同步盘目录、远程目录,数据的存储方式可以是:直接写入或通过特定API接口写入。
4. 保存用户文件恢复所需的“元数据”信息,所述“元数据信息”是指:(1)用户文件的名字空间,包括:目录结构信息和文件属性信息,其中,文件属性信息包括:文件名、大小、创建用户、创建时间、编码信息、加密信息、冗余方式等;(2)数据分块信息,包括:数据分块的存储位置信息,分块编号、MD5摘要值等。
5.“元数据信息”可采用自定义的二进制结构、XML通用结构,以及数据库方式进行实现。此外,对元数据建立Hash索引或数据库索引,便于数据检索操作。元数据的保存位置有以下几种:本地目录、同步盘目录、远程目录,数据的存储方式可以是:直接写入或通过特定API接口写入。
步骤(1)中,所述分块用Chunk来描述,每个Chunk由多个Block组成,所述“分块策略”就是要确定源文件到Chunk以及Block之间的映射,具体包括:每个Chunk中Block的个数,以及每个Block的大小,以及每个Block与源文件内容的对应关系等。每一个Chunk存储为一个独立的文件,每个Chunk包含Block的个数可变,缺省值是1024,每个Block的大小可变,缺省值是64KB。下面阐述两种常用的“分块策略”:策略1,将源文件按照Block的大小,顺序分割,每1024个(该个数可变)为1个Chunk,存储为1个单独的Chunk文件;策略2,将源文件按照Block的大小,顺序分割,记Block分割的序号为0,1,2,......n,以k个为1组,之后的k个再分别续接在第1组,直到1024组(组数可变),这样,第1个Chunk文件保存的Block序号是0,k,2k,一直到1023k,第2个Chunk文件保存的Block序号是1,k+1,2k+1,一直到1023k+1,第k个Chunk文件保存的Block序号是k-1,2k-1,3k-1,一直到1024k-1,第k+1个Chunk文件保存的Block序号是1024k,1025k,1026k,一直到2047k,以下依次类推,其中策略(1)适合副本冗余存储方式,策略(2)适合纠删码编码存储方式。
根据本发明的上述方法,可以解决以下几个问题:
(1)用户数据隐私保护;
(2)用户数据可用性保障;
(3)单一同步盘对文件大小的限制;
(4)单一同步盘对文件类型的限制;
(5)单一同步盘空间的限制。
本发明提供同步盘数据安全保护存储、读取、以及安全自组织与管理的实现方法,能够广泛应用于同步盘以及其它云存储安全领域。
有益效果:
(1)用户存储于同步盘的数据具有更高的安全性
同步盘提供商对用户数据的完全控制是数据安全的最大隐患。本发明将用户数据的控制权从之前的服务提供者反转到用户自身,最大可能地削弱用户对单一同步盘的依赖,每个同步盘服务提供者只控制用户的部分数据,且由于该数据已经过分块、编码或加密,因此,仅依靠这部分信息,无法恢复出用户的全部信息,可以从根本上消除用户对同步盘数据隐私问题的顾虑。此外,由于同一分块信息或通过编码,或通过副本,存储于不同的同步盘之中,即使个别的同步盘出现可用性问题,可以通过其它同步盘的数据采用副本或译码的方式恢复原始数据,与使用单一同步盘相比,可大幅提高用户数据的可用性。
(2)用户可以获得比单一同步盘更多的特性
本发明提供了一种同步盘数据安全自组织与管理方法,因此,可以实现同步盘的空间聚合,突破单一同步盘的空间限制,此外同步盘只负责存储数据分块或部分元数据,而并不直接存储完整的数据,因此,用户存储的文件大小和类型将不再受单一同步盘的限制。
(3)更好的普适性和可行性
本发明方法完全独立于同步盘系统,具体实施时,不需要现有的同步盘做任何适配,因此具有更好的普适性和可行性。
附图说明
图1为本发明方案组成图。
图2为本发明数据保护方法流程。
具体实施方式
本发明提供了一种同步盘数据安全保护方法,主要实现了同步盘用户数据的安全保护,同时突破了单一同步盘对使用空间、文件大小、文件类型等限制。
如图1所示,本发明所应用的对象为同步盘数据安全软件。具体包括:用户交互,安全策略管理,安全机制模块,纠删码算法库,加密算法库,密钥管理,压缩算法库、元数据管理,完整性检测,数据分布管理等模块。
“用户交互”模块包括:(1)用户信息显示,包括目录树结构、单个文件或目录信息、用户文件操作(上传或下载)进度、空间信息等;(2)用户文件操作,上传或下载文件或目录、终止或取消同步等;(3)用户参数配置,如隐私保护等级,可用性等级,数据特性,本地账户信息,同步盘账户信息等。
“安全策略管理”模块根据用户配置的安全需求来确定相应的安全策略,例如:确定数据的隐私保护策略,是加密还是编码;确定数据的可用性策略,是编码还是副本,以及确定数据是否需要压缩等。
“安全机制”模块主要是实现安全策略功能的支持。如数据的读取、分块功能,编码框架、加密框架以及压缩框架等。
“纠删码算法库”主要包括当前常用的纠删码算法实现,如Raid类算法在各平台的实现,RS算法实现等,这些算法向上提供统一接口,集成到“安全机制”的编码框架之中。
“加密算法库”主要包括当前常用的加密算法实现,如常用的对称加密算法:AES、DES、3DES等,以及非对称加密算法,如RSA等,这些算法向上提供统一接口,集成到“安全机制”的加密框架之中。
“密钥管理”主要负责具体加密算法所对应密钥的生成、存储、注销等,它向上提供统一接口,与“加密算法库”配合使用,实现用户数据的加解密。
“压缩算法库”主要集成当前常用的压缩算法实现,如常用的Rar、7zip、bz2等,这些算法实现集成到“安全机制”的加密框架之中。
“元数据管理”实现用户数据的元数据的管理与存储。元数据记录了用户数据的目录组织结构,目录信息,单个文件的属性信息、以及数据组织信息,如是否分块、分块大小、分块类型、是否编码、编码类型、是否压缩、压缩算法类型、是否加密、加密算法类型、加密密钥等。此外,还包括元数据自身的安全机制,如元数据的加密算法与加密密钥,元数据及副本的分布信息等。
“完整性检测”实现用户数据的完整性检测,确保数据存储的正确性。它包括数字摘要算法MD5的实现,以及数字摘要的存储与加密等。
“数据分布管理”主要负责分块数据的分布。用户的真实数据在确定安全策略后,会进行分块,“数据分布管理”会检测各个同步盘的信息,包括当前容量,文件数量等,以此为依据,确定每个分块数据所对应的同步盘,然后依次写入。
本发明数据保护方法流程步骤描述如下:
1. 用户数据在写入同步盘之前,先确定分块策略,然后执行该策略,对该数据进行分块;
2. 用户数据分块之后,对分块数据进行变换处理,具体的处理机制包括:加密、压缩、纠删码编码、副本冗余、MD5计算等处理方法中的一种或多种组合;
3. 将变换处理的输出数据,依据“存储策略”进行处理,其数据的存储位置有以下几种:本地目录、同步盘目录、远程目录,数据的存储方式可以是:直接写入或通过特定API接口写入。
4. 保存用户文件恢复所需的“元数据”信息,所述“元数据信息”是指:(1)用户文件的名字空间,包括:目录结构信息和文件属性信息,其中,文件属性信息包括:文件名、大小、创建用户、创建时间、编码信息、加密信息、冗余方式等;(2)数据分块信息,包括:数据分块的存储位置信息,分块编号、MD5摘要值等。“元数据信息”可采用自定义的二进制结构、XML通用结构,以及数据库方式进行实现。此外,对元数据建立Hash索引或数据库索引,便于数据检索操作。元数据的保存位置有以下几种:本地目录、同步盘目录、远程目录,数据的存储方式可以是:直接写入或通过特定API接口写入。
步骤(1)中,所述分块用Chunk来描述,每个Chunk由多个Block组成,所述“分块策略”就是要确定源文件到Chunk以及Block之间的映射,具体包括:每个Chunk中Block的个数,以及每个Block的大小,以及每个Block与源文件内容的对应关系等。每一个Chunk存储为一个独立的文件,每个Chunk包含Block的个数可变,缺省值是1024,每个Block的大小可变,缺省值是64KB。下面阐述两种常用的“分块策略”:策略1,将源文件按照Block的大小,顺序分割,每1024个(该个数可变)为1个Chunk,存储为1个单独的Chunk文件;策略2,将源文件按照Block的大小,顺序分割,记Block分割的序号为0,1,2,......n,以k个为1组,之后的k个再分别续接在第1组,直到1024组(组数可变),这样,第1个Chunk文件保存的Block序号是0,k,2k,一直到1023k,第2个Chunk文件保存的Block序号是1,k+1,2k+1,一直到1023k+1,第k个Chunk文件保存的Block序号是k-1,2k-1,3k-1,一直到1024k-1,第k+1个Chunk文件保存的Block序号是1024k,1025k,1026k,一直到2047k,以下依次类推,其中策略(1)适合副本冗余存储方式,策略(2)适合纠删码编码存储方式。
本发明方法的操作步骤如下:
(1)用户使用前预先申请若干同步盘账号,建议每个账号对应一个不同的同步盘提供商,总的个数推荐为3~4个。
(2)用户设置好同步盘相关参数,如同步目录等,启动同步盘,并设置为自动登录。
(3)用户登录“同步盘数据安全软件”;
(4)用户选择操作的源对象,如本地文件或“同步盘数据安全软件”上的远程文件;
(5)用户根据操作的类型,选择目标路径,或直接进行操作;
(6)“同步盘数据安全软件”返回操作结果。
本发明提供了一种同步盘数据保护方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,例如可以将该方法用于除同步盘之外的其它应用的数据保护,或者采用多种方式来实现该方法等,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (5)
1.一种同步盘数据安全保护方法,其特征是:对用户文件进行分块和变换处理,执行相应的存储策略,同时保存对应的元数据信息,用于用户文件的读取与恢复。
2.根据权利要求1所述的一种同步盘数据安全保护方法,其特征是:所述“变换处理”是指:加密、压缩、纠删码编码、副本冗余、MD5计算等处理方法中的一种或多种组合。
3.根据权利要求1所述的一种同步盘数据安全保护方法,其特征是:所述“存储策略”是指:用户文件进行分块和变化处理后,其数据的存储位置有以下几种:本地目录、同步盘目录、远程目录,数据的存储方式可以是:直接写入或通过特定API接口写入。
4.根据权利要求1所述的一种同步盘数据安全保护方法,其特征是:所述“元数据信息”是指:(1)用户文件的名字空间,包括:目录结构信息和文件属性信息,其中,文件属性信息包括:文件名、大小、创建用户、创建时间、编码信息、加密信息、及冗余方式;(2)数据分块信息,包括:数据分块的存储位置信息,分块编号、MD5摘要值等。
5.根据权利要求1所述的一种同步盘数据安全保护方法,其特征是:所述“元数据信息”采用自定义的二进制结构、XML通用结构,以及数据库方式进行实现,此外,对元数据建立Hash索引或数据库索引,便于数据检索操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013102048104A CN103248713A (zh) | 2013-05-29 | 2013-05-29 | 一种同步盘数据安全保护方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013102048104A CN103248713A (zh) | 2013-05-29 | 2013-05-29 | 一种同步盘数据安全保护方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103248713A true CN103248713A (zh) | 2013-08-14 |
Family
ID=48927934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013102048104A Pending CN103248713A (zh) | 2013-05-29 | 2013-05-29 | 一种同步盘数据安全保护方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103248713A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718808A (zh) * | 2016-01-18 | 2016-06-29 | 天津科技大学 | 一种基于多网盘的文件加密存储系统及方法 |
CN106095807A (zh) * | 2016-05-31 | 2016-11-09 | 中广天择传媒股份有限公司 | 一种分布式文件系统纠删码缓存装置及其缓存方法 |
CN106127083A (zh) * | 2016-06-15 | 2016-11-16 | 青岛恒金源电子科技有限公司 | 一种基于云盘的物流数据安全保护方法及系统 |
CN106127066A (zh) * | 2016-06-15 | 2016-11-16 | 青岛恒金源电子科技有限公司 | 一种基于云盘的历史数据文件安全保护方法及系统 |
CN109740308A (zh) * | 2018-12-28 | 2019-05-10 | 厦门吉比特网络技术股份有限公司 | 一种服务器端版本的保护方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101963982A (zh) * | 2010-09-27 | 2011-02-02 | 清华大学 | 基于位置敏感哈希的删冗存储系统元数据管理方法 |
CN102270161A (zh) * | 2011-06-09 | 2011-12-07 | 华中科技大学 | 一种基于纠删码的多等级容错数据存储、读取和恢复方法 |
US20120317122A1 (en) * | 2009-07-30 | 2012-12-13 | Cleversafe, Inc. | Dispersed storage network virtual address fields |
CN103118089A (zh) * | 2013-01-22 | 2013-05-22 | 华中科技大学 | 一种基于多个云存储系统的安全存储方法及其系统 |
-
2013
- 2013-05-29 CN CN2013102048104A patent/CN103248713A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120317122A1 (en) * | 2009-07-30 | 2012-12-13 | Cleversafe, Inc. | Dispersed storage network virtual address fields |
CN101963982A (zh) * | 2010-09-27 | 2011-02-02 | 清华大学 | 基于位置敏感哈希的删冗存储系统元数据管理方法 |
CN102270161A (zh) * | 2011-06-09 | 2011-12-07 | 华中科技大学 | 一种基于纠删码的多等级容错数据存储、读取和恢复方法 |
CN103118089A (zh) * | 2013-01-22 | 2013-05-22 | 华中科技大学 | 一种基于多个云存储系统的安全存储方法及其系统 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718808A (zh) * | 2016-01-18 | 2016-06-29 | 天津科技大学 | 一种基于多网盘的文件加密存储系统及方法 |
CN106095807A (zh) * | 2016-05-31 | 2016-11-09 | 中广天择传媒股份有限公司 | 一种分布式文件系统纠删码缓存装置及其缓存方法 |
CN106095807B (zh) * | 2016-05-31 | 2019-08-16 | 中广天择传媒股份有限公司 | 一种分布式文件系统纠删码缓存装置及其缓存方法 |
CN106127083A (zh) * | 2016-06-15 | 2016-11-16 | 青岛恒金源电子科技有限公司 | 一种基于云盘的物流数据安全保护方法及系统 |
CN106127066A (zh) * | 2016-06-15 | 2016-11-16 | 青岛恒金源电子科技有限公司 | 一种基于云盘的历史数据文件安全保护方法及系统 |
CN109740308A (zh) * | 2018-12-28 | 2019-05-10 | 厦门吉比特网络技术股份有限公司 | 一种服务器端版本的保护方法及系统 |
CN109740308B (zh) * | 2018-12-28 | 2021-04-16 | 厦门吉比特网络技术股份有限公司 | 一种服务器端版本的保护方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110062034B (zh) | 一种区块链大文件安全存储方法及系统 | |
EP3430515B1 (en) | Distributed storage system data management and security | |
CN107220559B (zh) | 一种针对不可篡改文件的加密存储方法 | |
EP2755161B1 (en) | Secure online distributed data storage services | |
Ateniese et al. | Remote data checking using provable data possession | |
US10180912B1 (en) | Techniques and systems for data segregation in redundancy coded data storage systems | |
CA2812986C (en) | Systems and methods for secure data sharing | |
Storer et al. | POTSHARDS: secure long-term storage without encryption | |
CN103248632A (zh) | 一种同步盘数据安全保护写入及读取方法 | |
US20120017096A1 (en) | More Elegant Exastore Apparatus and Method of Operation | |
CN104331346A (zh) | 一种数据保护方法 | |
US8667032B1 (en) | Efficient content meta-data collection and trace generation from deduplicated storage | |
CN104580395B (zh) | 一种基于现存云存储平台的多云协同存储中间件系统 | |
CN104603740A (zh) | 归档数据识别 | |
US8560785B1 (en) | Techniques for providing multiple levels of security for a backup medium | |
CN104410683A (zh) | 一种数据备份方法 | |
CN107154945A (zh) | 一种基于纠删码的多云碎片化安全存储方法及系统 | |
CN106302720B (zh) | 一种用于区块链可生存存储系统及其方法 | |
CN105120003A (zh) | 一种实现云环境下数据备份的方法 | |
CN104331345B (zh) | 一种数据恢复方法 | |
CN103763362A (zh) | 一种安全的分布式重复数据删除方法 | |
CN103248713A (zh) | 一种同步盘数据安全保护方法 | |
CN102693399B (zh) | 一种电子文档在线分离与还原的系统及方法 | |
US20120134494A1 (en) | Data Control Method of Cloud Storage | |
CN101082883A (zh) | 一种具有多层加密保护的存储装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130814 |