CN103618599B - 数据集加密前处理方法 - Google Patents
数据集加密前处理方法 Download PDFInfo
- Publication number
- CN103618599B CN103618599B CN201310648532.1A CN201310648532A CN103618599B CN 103618599 B CN103618599 B CN 103618599B CN 201310648532 A CN201310648532 A CN 201310648532A CN 103618599 B CN103618599 B CN 103618599B
- Authority
- CN
- China
- Prior art keywords
- data
- encryption
- data set
- packet
- data element
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 13
- 238000013480 data collection Methods 0.000 claims abstract description 5
- 239000012141 concentrate Substances 0.000 claims abstract description 4
- 238000013461 design Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Landscapes
- Traffic Control Systems (AREA)
- Storage Device Security (AREA)
Abstract
本发明公开了一种数据集加密前处理方法,属于信息加密领域,本发明先统计数据集的元素总量,然后计算数据集需要加密的轮数,最后对数据集中各数据元素进行分组;通过对加密前的数据进行处理,本发明使得量大的数据集在进行加密时更加高效、安全,适合任意结构的大规模数据集,能够节约后期加密时间。
Description
技术领域
本发明属于信息加密领域,特别是涉及一种数据集加密前处理方法。
背景技术
随着云计算的发展,由互联网产生和处理的数据量日益增加。大数据几乎贯穿了整个现实世界,然而在享受大数据所带来的便利的同时,个人数据的隐私和企业数据的安全性也越来越受到重视。密码学是防止数据被非法篡改和窃听的有效手段,然而将现有的密码标准直接应用于大规模数据集的加密其安全性尚未有充分的证明。如利用AES算法加密的图像可能会泄露部分信息,因此不恰当地使用已有的加密算法并不能确保数据的安全。
加密算法的一个重要要求是实现加密的全局扩散性,即任一明文数据的改变将影响全体密文数据。分组密码算法只能实现分组内的扩散,用于加密数据时可能会泄露数据的部分信息,而全局扩散性则可防止这类情况的发生。排列是图像加密中最常用的加密操作。目前有文献研究了在分组模式下对图像加密算法扩散性能的分析,并提出了基于四叉树的排列算法。然而该算法适用性太窄,仅适用于图像加密且要求图像的像素大小为2a×2a,a为正整数,不适用于任意结构的大量数据集。且目前尚未有标准的适合大规模数据集的加密算法。因此如何设计一个适合大规模数据集的分布式的数据集加密前处理方法,以便于进行高效的加密就显得非常具有研究意义和实用价值。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种高效、安全的数据集加密前处理方法。
为实现上述目的,本发明提供了一种数据集加密前处理方法,包括以下步骤:
步骤一、统计数据集的元素总量N,N为正整数;
步骤二、计算数据集需要加密的轮数;
步骤三、对数据集中各数据元素进行分组;其按以下步骤进行:
A1、将数据集中数据元素的位置用m位二进制数表示,m为正整数,2m≤N<2m+1;
A2、对数据集中的数据元素按分组策略进行分组;
所述对数据集中的数据元素按分组策略进行分组按以下步骤执行:
判断数据集的元素总量N;当N=2m时,则数据元素所在的分组由数据集中数据元素的位置右移一位得到;当2m<N<2m+1且数据集中数据元素的位置小于2m时,则数据元素所在的分组由数据集中数据元素的位置右移一位得到;否则对该数据集中的数据元素从其父节点开始依次查找其祖宗节点,其分组等于未再分组的最近祖宗节点所在的分组。
进一步的,所述步骤三后还包括对数据集各分组的数据进行并行加密的步骤。
进一步的,为了加密更加全面安全,所述对数据集各分组的数据进行并行加密的步骤后还包括以下步骤:
B1、判断当前加密轮数是否小于需要加密的轮数,如果当前加密轮数小于需要加密的轮数,则执行步骤B2;否则加密完成,输出密文数据;
B2、对加密后的数据集中的各个元素的位置使用排列算法进行重新排列,计算其新的位置和所在的分组,加密轮数加1,然后对数据集各分组的数据进行并行加密。
较佳的,步骤二中所述需要加密的轮数按以下步骤计算:对于2y≤N<2y+1,所需要的加密轮数=y+2,y为正整数。
较佳的,所述步骤B2中分组排列算法按以下步骤进行:
C1:获取数据集中各数据元素原来的位置;
C2:当N%2不等于0且数据集中各数据元素原来的位置>2m时,则该数据元素新的位置等于该数据元素原来的位置;否则该数据元素新的位置由函数
fr(xNxN-1...xr+1xr...x2x1)=xNxN-1...xr+1xr...x2x1+(xr+1-x1)(1-2r)计算得到,其中r为当前加密的轮数,r为正整数;fr(xNxN-1...xr+1xr...x2x1)为该数据元素新的位置;xNxN-1...xr+1xr...x2x1为该数据元素原来的位置;xh表示第h位所代表的二进制的值,h=1,2,3,…,N。
本发明的有益效果是:本发明通过对加密前的数据进行处理,使得量大的数据集在进行加密时更加高效、安全,适合任意结构的大规模数据集,能够节约后期加密时间。
附图说明
图1是本发明一具体实施方式的流程示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明:
如图1所示,一种数据集加密前处理方法,包括以下步骤:
步骤一、统计数据集的元素总量N,N为正整数。
步骤二、计算数据集需要加密的轮数。
步骤三、对数据集中各数据元素进行分组;其按以下步骤进行:
A1、将数据集中数据元素的位置用m位二进制数表示,表示为xmxm-1…x2x1;m为正整数,2m≤N<2m+1;xi表示第i位所代表的二进制的值,i=1,2,3,…,m。
A2、对数据集中的数据元素按分组策略进行分组;
所述对数据集中的数据元素按分组策略进行分组按以下步骤执行:
判断数据集的元素总量N;当N=2m时,则数据元素所在的分组由数据集中数据元素的位置右移一位得到;当2m<N<2m+1且数据集中数据元素的位置小于2m时,则数据元素所在的分组由数据集中数据元素的位置右移一位得到;否则对该数据集中的数据元素从其父节点开始依次查找其祖宗节点,其分组等于未再分组的最近祖宗节点所在的分组。
步骤四、对数据集各分组的数据进行并行加密。
步骤五、判断当前加密轮数是否小于需要加密的轮数,如果当前加密轮数小于需要加密的轮数,则执行步骤六;否则加密完成,输出密文数据。
步骤六、对加密后的数据集中的各个元素的位置使用排列算法进行重新排列,计算其新的位置和所在的分组,加密轮数加1,然后对数据集各分组的数据进行并行加密。
本实施例中,步骤二中所述需要加密的轮数按以下步骤计算:对于2y≤N<2y+1,所需要的加密轮数=y+2,y为正整数。否则加密轮数可以根据需要取任意值。
所述步骤六中分组排列算法按以下步骤进行:
C1:获取数据集中各数据元素原来的位置;
C2:当N%2不等于0且数据集中各数据元素原来的位置>2m时,则该数据元素新的位置等于该数据元素原来的位置;否则该数据元素新的位置由函数
fr(xNxN-1...xr+1xr...x2x1)=xNxN-1...xr+1xr...x2x1+(xr+1-x1)(1-2r)计算得到,其中r为当前加密的轮数,r为正整数;fr(xNxN-1...xr+1xr...x2x1)为该数据元素新的位置;xNxN-1...xr+1xr...x2x1为该数据元素原来的位置;xh表示第h位所代表的二进制的值,h=1,2,3,…,N,比较时将数据集中各数据元素原来的位置转化为整数再与2m进行比较。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (5)
1.一种数据集加密前处理方法,其特征在于包括以下步骤:
步骤一、统计数据集的元素总量N,N为正整数;
步骤二、计算数据集需要加密的轮数;
步骤三、对数据集中各数据元素进行分组;其按以下步骤进行:
A1、将数据集中数据元素的位置用m位二进制数表示,m为正整数,2m≤N<2m+1;
A2、对数据集中的数据元素按分组策略进行分组;
所述对数据集中的数据元素按分组策略进行分组按以下步骤执行:
判断数据集的元素总量N;当N=2m时,则数据元素所在的分组由数据集中数据元素的位置右移一位得到;当2m<N<2m+1且数据集中数据元素的位置小于2m时,则数据元素所在的分组由数据集中数据元素的位置右移一位得到;否则对该数据集中的数据元素从其父节点开始依次查找其祖宗节点,其分组等于未再分组的最近祖宗节点所在的分组。
2.如权利要求1所述的数据集加密前处理方法,其特征在于:所述步骤三后还包括对数据集各分组的数据进行并行加密的步骤。
3.如权利要求2所述的数据集加密前处理方法,其特征在于:所述对数据集各分组的数据进行并行加密的步骤后还包括以下步骤:
B1、判断当前加密轮数是否小于需要加密的轮数,如果当前加密轮数小于需要加密的轮数,则执行步骤B2;否则加密完成,输出密文数据;
B2、对加密后的数据集中的各个元素的位置使用排列算法进行重新排列,计算其新的位置和所在的分组,加密轮数加1,然后对数据集各分组的数据进行并行加密。
4.如权利要求1所述的数据集加密前处理方法,其特征是:步骤二中所述需要加密的轮数按以下步骤计算:对于2y≤N<2y+1,所需要的加密轮数=y+2,y为正整数。
5.如权利要求3所述的数据集加密前处理方法,其特征是:所述步骤B2中分组排列算法按以下步骤进行:
C1:获取数据集中各数据元素原来的位置;
C2:当N%2不等于0且数据集中各数据元素原来的位置>2m时,则该数据元素新的位置等于该数据元素原来的位置;否则该数据元素新的位置由函数
fr(xNxN-1...xr+1xr...x2x1)=xNxN-1...xr+1xr...x2x1+(xr+1-x1)(1-2r)计算得到,其中r为当前加密的轮数,r为正整数;fr(xNxN-1...xr+1xr...x2x1)为该数据元素新的位置;xNxN-1...xr+1xr...x2x1为该数据元素原来的位置;xh表示第h位所代表的二进制的值,h为正整数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310648532.1A CN103618599B (zh) | 2013-12-04 | 2013-12-04 | 数据集加密前处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310648532.1A CN103618599B (zh) | 2013-12-04 | 2013-12-04 | 数据集加密前处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103618599A CN103618599A (zh) | 2014-03-05 |
CN103618599B true CN103618599B (zh) | 2016-09-14 |
Family
ID=50169303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310648532.1A Expired - Fee Related CN103618599B (zh) | 2013-12-04 | 2013-12-04 | 数据集加密前处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103618599B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117688612B (zh) * | 2024-01-31 | 2024-04-26 | 青岛闪收付信息技术有限公司 | 一种电子债权凭证数据信息安全存储方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101394553A (zh) * | 2008-09-28 | 2009-03-25 | 华为技术有限公司 | 图像加密、解密方法和装置 |
CN101582760A (zh) * | 2008-05-16 | 2009-11-18 | 中国科学院研究生院 | 一种基于树结构的密钥加密存储方法 |
CN102474602A (zh) * | 2009-07-02 | 2012-05-23 | 汤姆逊许可证公司 | 用于使用自适应树选择来对二进制集进行视频编解码的方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040202326A1 (en) * | 2003-04-10 | 2004-10-14 | Guanrong Chen | System and methods for real-time encryption of digital images based on 2D and 3D multi-parametric chaotic maps |
-
2013
- 2013-12-04 CN CN201310648532.1A patent/CN103618599B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101582760A (zh) * | 2008-05-16 | 2009-11-18 | 中国科学院研究生院 | 一种基于树结构的密钥加密存储方法 |
CN101394553A (zh) * | 2008-09-28 | 2009-03-25 | 华为技术有限公司 | 图像加密、解密方法和装置 |
CN102474602A (zh) * | 2009-07-02 | 2012-05-23 | 汤姆逊许可证公司 | 用于使用自适应树选择来对二进制集进行视频编解码的方法和装置 |
Non-Patent Citations (1)
Title |
---|
《分组排列模式下图像加密算法的扩散性能分析与实现》;周庆等;《电子与信息学报》;20100831;第32卷(第8期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103618599A (zh) | 2014-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103795523B (zh) | 用于电子招投标的电子标书多层加解密系统及方法 | |
CN104038349A (zh) | 一种基于kp-abe的有效可验证的公钥可搜索加密方法 | |
CN108111295B (zh) | 一种基于类模运算的同态加密方法 | |
CN110413652B (zh) | 一种基于边缘计算的大数据隐私化检索方法 | |
CN103138917A (zh) | 以s盒输入为基础的汉明距离模型在sm4密码算法侧信道能量分析的应用 | |
CN102983965A (zh) | 变电站量子通信模型、量子密钥分发中心及模型实现方法 | |
CN104506313A (zh) | 一种支持大规模动态变化的量子密钥分发保密增强方法 | |
CN103530474A (zh) | 面向aes算法电路的差分功耗攻击测试方法 | |
CN102546157A (zh) | 一种抵抗能量分析的随机混合加密系统及其实现方法 | |
CN103679008A (zh) | 一种高效的安全芯片功耗攻击测试方法 | |
CN103220146B (zh) | 基于多变量公钥密码体制的零知识数字签名方法 | |
CN103916248A (zh) | 一种全同态加密公钥空间压缩方法 | |
CN109190395B (zh) | 一种基于数据变换的全同态加密方法及系统 | |
CN101908111B (zh) | 一种利用dpa曲线极性进行密钥提取的方法及系统 | |
CN109379177A (zh) | 一种同态密文计算加速逻辑系统及实现方法 | |
CN107483182A (zh) | 一种基于乱序执行的面向aes算法的抗功耗攻击方法 | |
CN111191253B (zh) | 一种数据加密组合方法 | |
CN115102699A (zh) | 数据安全去重及数据恢复方法、系统、介质、设备及终端 | |
CN105933101A (zh) | 一种基于参数高次偏移的全同态加密公钥压缩方法 | |
CN103400072A (zh) | 哈希值密码的恢复方法和装置 | |
Tong et al. | BFSN: a novel method of encrypted traffic classification based on bidirectional flow sequence network | |
CN106301776B (zh) | 一种关键字搜索的多授权中心外包属性基加密方法及系统 | |
CN106161437B (zh) | 一种基于ElGamal的高效的可搜索公钥加密方案 | |
CN105933120A (zh) | 一种基于Spark平台的口令哈希值恢复方法和装置 | |
CN104009847A (zh) | 一种基于格的大数据存储完整性验证方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160914 |