CN109033367A - 一种面向二维表文件的属性竖切多云存储方法 - Google Patents

一种面向二维表文件的属性竖切多云存储方法 Download PDF

Info

Publication number
CN109033367A
CN109033367A CN201810839098.8A CN201810839098A CN109033367A CN 109033367 A CN109033367 A CN 109033367A CN 201810839098 A CN201810839098 A CN 201810839098A CN 109033367 A CN109033367 A CN 109033367A
Authority
CN
China
Prior art keywords
column
list file
fragment
uploaded
dimentional list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810839098.8A
Other languages
English (en)
Inventor
佘堃
张鸣
张一鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201810839098.8A priority Critical patent/CN109033367A/zh
Publication of CN109033367A publication Critical patent/CN109033367A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种面向二维表文件的属性竖切多云存储方法,属于数据信息安全技术领域,首先将待存储二维表的每列属性中存储的内容字段拆分为两部分,形成两倍于原数据列数的碎片列;接着将所述碎片列按照在原数据中的位置进行标号;接着将标号后的碎片列进行重新组合,得到n个二维表文件,并将得到的n个二维表文件分别上传至n个云服务器;本发明极大的提高了二维表远程数据储存的安全性,有效的防止黑客截获数据进行破解。

Description

一种面向二维表文件的属性竖切多云存储方法
技术领域
本发明涉及数据信息安全技术领域,具体涉及一种面向二维表文件的属性竖切多云存储方法。
背景技术
二维表文件是目前应用广泛的一大类文件类型,如Excel表格,数据库表格,甚至是JSON格式数据等等。在一个二维表中每一行称为一个元组,每一列称为一个属性,每一个表格单元为一个内容字段。
目前二维表文件的上传和下载方法与其他各种类型的文件一样,在文件传输安全方面存在和普通文件一样的隐私安全问题。虽然已经有很多针对普通文件的多云存储技术和策略,但并没有针对二维表文件的技术和方法,二维表文件本身特殊的数据结构没有得到很好的利用。
发明内容
本发明的目的在于:提供一种面向二维表文件的属性竖切多云存储方法,解决了现有文件同步处理方法采用单一的源文件上传方式,安全隐患大、用户隐私易泄露的技术问题。
本发明采用的技术方案如下:
一种面向二维表文件的属性竖切多云存储方法,包括以下步骤:
步骤1:将待存储二维表的每列属性中存储的内容字段拆分为两部分,形成两倍于原数据列数的碎片列;
步骤2:将所述碎片列按照在原数据中的位置进行标号;
步骤3:将标号后的碎片列进行重新组合,得到n个二维表文件,并将得到的n个二维表文件分别上传至n个云服务器。
进一步的,所述步骤1中,将内容字段拆分为两部分的具体方法为:
步骤11:计算每个内容字段的字段长度,判断字段长度是否为奇数,若为奇数,则在该内容字段末增加一个null占位符,否则不添加占位符;
步骤12:将每列属性中的每个内容字段按照字段长度进行均分,取出均分的一半内容,形成新列,另一半内容位于原列,所述新列和原列构成所有的碎片列。
进一步的,所述步骤3中,重新组合的方法包括:
将碎片列随机组合成n个二维表文件并分别上传至n个云服务器;或
碎片列中奇数列和偶数列均分别形成一个二维表文件,分别上传至不同的云服务器;或
将碎片列中相邻列的位置互换,形成一个二维表文件,并上传至一个云服务器。
进一步的,将二维表上传至云服务器的上传方法包括:
按照二维表文件生成的顺序依次上传至n个云服务器;或
将二维表文件优先上传至传输速率高和储存压力小的云服务器。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
本发明的优势在于处理文件的方式是针对二维表文件的特点来进行的。二维表文件的属性列是用户数据的核心内容,而属性列的特点是规整,格式相同。因此先通过在逻辑层对每条属性列进行竖向切割,然后将切割后的碎片数列重组成一定数量的碎片文件,最后将碎片文件上传到云服务器。
对于从碎片数列重组成碎片文件的过程可以针对实际情况采用不同的方法,如随机重组,按照奇偶性重组等等,最后的碎片文件上传至多个云服务器的策略也可以有很多选择,甚至可以借鉴已有的文件切分多云存储方法。
本发明极大的提高了二维表远程数据储存的安全性,有效的防止黑客截获数据进行破解。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明的整体流程图;
图2是本发明中属性竖切的模型示意图;
图3是本发明针对Excel表格文件的竖切多云存储流程图。
图4是本发明针对数据库文件的竖切多云存储流程图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
下面结合图1-4对本发明作详细说明。
一种面向二维表文件的属性竖切多云存储方法,包括以下步骤(如图1所示):
步骤1:将待存储二维表的每列属性中存储的内容字段拆分为两部分,形成两倍于原数据列数的碎片列;
步骤2:将所述碎片列按照在原数据中的位置进行标号;
步骤3:将标号后的碎片列进行重新组合,得到n个二维表文件,并将得到的n个二维表文件分别上传至n个云服务器。
进一步的,所述步骤1中,将内容字段拆分为两部分的具体方法为:
步骤11:计算每个内容字段的字段长度,判断字段长度是否为奇数,若为奇数,则在该内容字段末增加一个null占位符,否则不添加占位符;
步骤12:将每列属性中的每个内容字段按照字段长度进行均分,取出均分的一半内容,形成新列,另一半内容位于原列,所述新列和原列构成所有的碎片列。
进一步的,所述步骤3中,重新组合的方法包括:
将碎片列随机组合成n个二维表文件并分别上传至n个云服务器;或
碎片列中奇数列和偶数列均分别形成一个二维表文件,分别上传至不同的云服务器;或
将碎片列中相邻列的位置互换,形成一个二维表文件,并上传至一个云服务器。
进一步的,将二维表上传至云服务器的上传方法包括:
按照二维表文件生成的顺序依次上传至n个云服务器;或
将二维表文件优先上传至传输速率高和储存压力小的云服务器。
具体实施例1
图2所示的为本发明的表格属性模型图。图中实线代表二维表文件的内容部分,虚线代表切割位置。“切割”的真正含义是对字段内容进行长度计算后字符串截断处理,前一半内容仍放在原列中,后一半内容保存在新的一列中。这样切割后的二维表文件的列数为原来的两倍。
图3所示的是针对常见的Excel表格文件的竖切多云存储的流程图。Excel是常见的二维表,以Excel表格为例具有一定的普遍性,但需要强调的是本发明不仅仅针对Excel表格,而是针对所有的二维表类型文件(如数据库表格文件等)。当实施对象变为其他类型的文件时,实施方法的细节也需要做出适当调整。
在步骤102中,首先从客户端获取Excel表文件,进入步骤104。在步骤104中,计算表格中所有单元格中内容字段的长度,对这些字段的长度进行判断;若长度为奇数,则进入步骤106;否则,将直接进入步骤108;在步骤106中,对步骤104中判定的奇数长度字段,在字段内容的末尾增加一个null占位符,以保证所有字段的长度都为偶数;后进入步骤108。
在步骤108中,表中所有单元格内容字段的长度通过106步骤处理完以后,每列属性所有单元格的内容字段长度都为偶数。对每列的内容字段的做竖切处理:将所有的单元格内的内容从中间分成两个部分,前一部分扔保留在原列中。在每列表格右边新建列,将后一部分保存在新列中,得到两倍于原列数的列数,之后进入步骤110。在步骤110中,对步骤108中处理完的所有列数进行标号,具体方法是在每列最后添加一新的单元格用来存放序号(服务器将保证在用户下载文件时按照此序号恢复源文件,并最后删除序号)。在步骤112中,将步骤110中标完号的所有列随机组合,得到n个新的Excel文件,其中n等于当前云服务器的数目。在步骤114中,将n个Excel文件分别上传至不同的云服务器。
具体实施例2
本实施例用于说明本发明在数据库中的应用。
图4所示的是针对数据库文件的竖切多云存储的流程图。当实施对象变为其他类型的文件时,实施方法的细节也需要做出适当调整。
在步骤202中,首先从客户端获取数据库文件,进入步骤204;在步骤204中,将数据库表中每列字段名中的内容当作记录插入到每列最后一行;在步骤206中,计算表格中所有单元格中内容字段的长度,对这些字段的长度进行判断;若长度为奇数,则进入步骤208;否则,将直接进入步骤210;在步骤208中,对步骤206中判定的奇数长度字段,在字段内容的末尾增加一个null占位符,以保证所有字段的长度都为偶数;后进入步骤210。
在步骤210中,表中所有单元格内容字段的长度通过208步骤处理完以后,每列属性所有单元格的内容字段长度都为偶数;在每列表格右边新建数据库字段列,并将所有列从1开始标号,将字段名全部改为标号数字,后进入步骤212。
在步骤212中,对每列的内容字段的做竖切处理:将所有的字段内容从中间分成两个部分,前一部分扔保留在原列中,将后一部分保存在右边新建的字段列中,得到两倍于原列数的字段列。之后进入步骤214。
在步骤214中,对步骤212中得到所有列随机组合成n个数据库文件。这些数据库文件的字段名为序号,原字段名为最后一行记录。(服务器将保证在用户下载文件时按照此序号字段名恢复源文件,最后一行记录中保存的原字段名将替换序号字段名)在步骤216中,将步骤214中得到的n个新的数据库文件分别上传至不同的云服务器。
以上所述,仅为本发明的优选实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域的技术人员在本发明所揭露的技术范围内,可不经过创造性劳动想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书所限定的保护范围为准。

Claims (4)

1.一种面向二维表文件的属性竖切多云存储方法,其特征在于:包括以下步骤:
步骤1:将待存储二维表的每列属性中存储的内容字段拆分为两部分,形成两倍于原数据列数的碎片列;
步骤2:将所述碎片列按照在原数据中的位置进行标号;
步骤3:将标号后的碎片列进行重新组合,得到n个二维表文件,并将得到的n个二维表文件分别上传至n个云服务器。
2.根据权利要求1所述的一种面向二维表文件的属性竖切多云存储方法,其特征在于:所述步骤1中,将内容字段拆分为两部分的具体方法为:
步骤11:计算每个内容字段的字段长度,判断字段长度是否为奇数,若为奇数,则在该内容字段末增加一个null占位符,否则不添加占位符;
步骤12:将每列属性中的每个内容字段按照字段长度进行均分,取出均分的一半内容,形成新列,另一半内容位于原列,所述新列和原列构成所有的碎片列。
3.根据权利要求1所述的一种面向二维表文件的属性竖切多云存储方法,其特征在于:所述步骤3中,重新组合的方法包括:
将碎片列随机组合成n个二维表文件并分别上传至n个云服务器;或
碎片列中奇数列和偶数列均分别形成一个二维表文件,分别上传至不同的云服务器;或
将碎片列中相邻列的位置互换,形成一个二维表文件,并上传至一个云服务器。
4.根据权利要求1所述的一种面向二维表文件的属性竖切多云存储方法,其特征在于:将二维表上传至云服务器的上传方法包括:
按照二维表文件生成的顺序依次上传至n个云服务器;或
将二维表文件优先上传至传输速率高和储存压力小的云服务器。
CN201810839098.8A 2018-07-26 2018-07-26 一种面向二维表文件的属性竖切多云存储方法 Pending CN109033367A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810839098.8A CN109033367A (zh) 2018-07-26 2018-07-26 一种面向二维表文件的属性竖切多云存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810839098.8A CN109033367A (zh) 2018-07-26 2018-07-26 一种面向二维表文件的属性竖切多云存储方法

Publications (1)

Publication Number Publication Date
CN109033367A true CN109033367A (zh) 2018-12-18

Family

ID=64646799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810839098.8A Pending CN109033367A (zh) 2018-07-26 2018-07-26 一种面向二维表文件的属性竖切多云存储方法

Country Status (1)

Country Link
CN (1) CN109033367A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112149183A (zh) * 2020-10-19 2020-12-29 关涛 一种通过数据云功能实现数据“物理”切割系统
EP4137978A1 (en) 2021-08-18 2023-02-22 Oroundo Mobile GmbH - Podruznica Zagreb Enhanced data security through combination of encryption and vertical fragmentation of tabular data

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103856499A (zh) * 2012-11-29 2014-06-11 中兴通讯股份有限公司 云存储方法及装置、云存储数据下载方法及装置
CN104539733A (zh) * 2015-01-20 2015-04-22 电子科技大学 一种隐私碎片文件的云同步方法
CN104573557A (zh) * 2015-01-20 2015-04-29 北京古盘创世科技发展有限公司 云端数据储存方法及装置和云端数据还原方法
CN104754055A (zh) * 2015-04-03 2015-07-01 易云捷讯科技(北京)有限公司 一种多云环境下的安全云存储方法
CN105279198A (zh) * 2014-07-24 2016-01-27 北京古盘创世科技发展有限公司 数据表储存、修改、查询和统计方法
CN105426775A (zh) * 2015-11-09 2016-03-23 北京联合大学 一种保护智能手机信息安全的方法和系统
CN105827512A (zh) * 2016-04-29 2016-08-03 电子科技大学 一种通过碎片化多云存储的电子邮件通信方法
CN105893511A (zh) * 2016-03-30 2016-08-24 电子科技大学 一种使用代理云进行数据拷贝留痕的方法
US20170143291A1 (en) * 2015-11-19 2017-05-25 General Electric Company Water equivalent diameter determination from scout images
CN106911770A (zh) * 2017-02-20 2017-06-30 北京古盘创世科技发展有限公司 一种基于多云存储的数据共享方法及系统
CN107154945A (zh) * 2017-05-31 2017-09-12 中南大学 一种基于纠删码的多云碎片化安全存储方法及系统
CN107358084A (zh) * 2017-07-25 2017-11-17 湖南云迪生物识别科技有限公司 数据的云存储方法和装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103856499A (zh) * 2012-11-29 2014-06-11 中兴通讯股份有限公司 云存储方法及装置、云存储数据下载方法及装置
CN105279198A (zh) * 2014-07-24 2016-01-27 北京古盘创世科技发展有限公司 数据表储存、修改、查询和统计方法
CN104539733A (zh) * 2015-01-20 2015-04-22 电子科技大学 一种隐私碎片文件的云同步方法
CN104573557A (zh) * 2015-01-20 2015-04-29 北京古盘创世科技发展有限公司 云端数据储存方法及装置和云端数据还原方法
CN104754055A (zh) * 2015-04-03 2015-07-01 易云捷讯科技(北京)有限公司 一种多云环境下的安全云存储方法
CN105426775A (zh) * 2015-11-09 2016-03-23 北京联合大学 一种保护智能手机信息安全的方法和系统
US20170143291A1 (en) * 2015-11-19 2017-05-25 General Electric Company Water equivalent diameter determination from scout images
CN105893511A (zh) * 2016-03-30 2016-08-24 电子科技大学 一种使用代理云进行数据拷贝留痕的方法
CN105827512A (zh) * 2016-04-29 2016-08-03 电子科技大学 一种通过碎片化多云存储的电子邮件通信方法
CN106911770A (zh) * 2017-02-20 2017-06-30 北京古盘创世科技发展有限公司 一种基于多云存储的数据共享方法及系统
CN107154945A (zh) * 2017-05-31 2017-09-12 中南大学 一种基于纠删码的多云碎片化安全存储方法及系统
CN107358084A (zh) * 2017-07-25 2017-11-17 湖南云迪生物识别科技有限公司 数据的云存储方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
何家旸: "基于信息分散的多云存储中间件的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
张一鸣: "车联网安全事件检测分析和主动赋能系统的研究与实现", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112149183A (zh) * 2020-10-19 2020-12-29 关涛 一种通过数据云功能实现数据“物理”切割系统
CN112149183B (zh) * 2020-10-19 2024-03-29 关涛 一种通过数据云功能实现数据“物理”切割系统
EP4137978A1 (en) 2021-08-18 2023-02-22 Oroundo Mobile GmbH - Podruznica Zagreb Enhanced data security through combination of encryption and vertical fragmentation of tabular data

Similar Documents

Publication Publication Date Title
US11232253B2 (en) Document capture using client-based delta encoding with server
CN104965845B (zh) 一种小文件的定位方法及系统
US8234372B2 (en) Writing a file to a cloud storage solution
US8260913B2 (en) Reading a file from a cloud storage solution
US8719223B2 (en) Cloud storage solution for reading and writing files
AU2022200375A1 (en) Temporal optimization of data operations using distributed search and server management
US20150199307A1 (en) Pluggable Architecture For Optimizing Versioned Rendering of Collaborative Documents
CN107045531A (zh) 一种优化hdfs小文件存取的系统及方法
CN103227818A (zh) 终端、服务器、文件传输方法、文件存储管理系统和方法
CN111127017A (zh) 基于p2p存储网络和多层架构的区块链全分片方法及装置
CN110347651A (zh) 基于云存储的数据同步方法、装置、设备及存储介质
CN109033367A (zh) 一种面向二维表文件的属性竖切多云存储方法
CN103414759A (zh) 网盘文件传输方法和装置
CN110377579A (zh) 文件存储方法、装置及服务器
CN113468199A (zh) 索引更新方法及系统
CN112597348A (zh) 一种大数据存储优化的方法及装置
CN111447265A (zh) 文件存储方法、文件下载方法和文件处理方法及相关组件
CN117312296B (zh) 一种多平台协作的数据处理方法
CN106682022A (zh) 一种日志查询方法和装置
CN113901395A (zh) 数据处理方法、装置、计算机设备和存储介质
CN106990914A (zh) 数据删除方法及装置
CN112395281B (zh) 一种异构多源数据融合系统
CN108182209A (zh) 一种数据索引方法、及设备
CN116150092A (zh) 电子档案文件快速校验方法、系统、设备及介质
CN108920542A (zh) 一种分布式内存大数据处理系统及其数据处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218