CN111338572A - 一种可调节加密重复数据删除方法 - Google Patents

一种可调节加密重复数据删除方法 Download PDF

Info

Publication number
CN111338572A
CN111338572A CN202010100701.8A CN202010100701A CN111338572A CN 111338572 A CN111338572 A CN 111338572A CN 202010100701 A CN202010100701 A CN 202010100701A CN 111338572 A CN111338572 A CN 111338572A
Authority
CN
China
Prior art keywords
key
frequency
plaintext block
plaintext
key server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010100701.8A
Other languages
English (en)
Other versions
CN111338572B (zh
Inventor
李经纬
杨祚儒
任彦璟
李柏晴
张小松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010100701.8A priority Critical patent/CN111338572B/zh
Publication of CN111338572A publication Critical patent/CN111338572A/zh
Application granted granted Critical
Publication of CN111338572B publication Critical patent/CN111338572B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • G06F3/0641De-duplication techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种可调节加密重复数据删除方法,属于信息安全技术领域。本发明包括客户端、密钥服务器,密钥服务器先后配置平衡参数t、维护系统全局秘密s、估算明文块M的频率f,并计算中间参数x、计算和选择密钥种子k返回至客户端,客户端计算明文块M的密钥K。本发明采用基于CM‑Sketch频率统计技术、密钥概率生成技术以及平衡参数自动设定技术,解决现有加密重复数据删除系统中的存储效率与抗频率分析的量化及平衡问题。

Description

一种可调节加密重复数据删除方法
技术领域
本发明属于信息安全技术领域,涉及将原始逻辑(明文)块转换为密文块的方法,尤其涉及面向加密重复数据删除存储系统中抵御数据频率泄漏的技术和方法。
背景技术
重复数据删除(data deduplication)是一种通过消除重复副本来降低存储开销的数据压缩技术:系统将文件划分为若干个逻辑明文块,比较各逻辑块与已存储的物理明文块的内容;当发现重复内容时,将冗余的逻辑块替换为指向相应物理块的引用(reference),以节省存储空间。
加密重复数据删除(encrypted deduplication)通过加密技术将原始逻辑(明文)块转换为密文块,针对密文块实施重复数据删除后存储只具有唯一内容的密文块,以保护数据隐私。传统对称加密技术(SKE,symmetric-key encryption)采用随机密钥加密/解密,导致重复的明文块被加密为不同的密文块,难以兼容重复数据删除。消息锁定加密技术(MLE,message-locked encryption,见文献M.Bellare,S.Keelveedhi,andT.Ristenpart.Message-Locked Encryption and Secure Deduplication.AdvancesinCryptology-EUROCRYPT,pp.296-312,2013)基于明文块的数据内容产生密钥,从而将相同明文块加密为相同密文块,兼容重复数据删除。
然而,MLE技术由于采用确定性加密(即相同明文块被加密为相同密文块)泄漏了明文块出现频率;例如,如果一个明文块出现了n次,则它对应的密文块也将出现n次。相关研究表明,可利用MLE的频率泄漏信息推断密文块的原始明文内容(见文献J.Li,C.Qin,P.P.C.Lee,et al.Information Leakage in Encrypted Deduplication via FrequencyAnalysis.Proceedings of the 47th lEEE/IFIP International Conference onDependable Systems and Networks,2017)。
因此,为加密重复数据删除选择合适的加密技术是一个难题:MLE技术兼容重复数据删除,能够实现存储空间节省,但由于其加密的确定性,导致频率信息泄漏;SKE技术能够达到传统语义安全目标,可防止频率泄漏,但难以兼容重复数据删除。为了解决上述难题,现有工作提出了如下方法:
随机MLE(见文献M.Abadi,D.Boneh,llya Mironov,et al.Message-LockedEncryption for Lock-Dependent Messages.Advances in Cryptology-CRYPTO,pp.374-391,2013)使用随机密钥加密;为了支持重复数据删除,为每个密文块附加随机载荷(payload),用于检测相应明文块是否相同。
交互式MLE(见文献M.Bellare and S.Keelveedhi.Interactive Message-LockedEncryption and Secure Deduplication.Public-Key Cryptography-PKC,pp.516-538,2015)也使用随机密钥加密明文块;为了支持重复数据删除,利用全同态加密技术检测产生的密文块是否源于相同明文而无需解密。
分层加密(见文献J.Stanek,A.Sorniotti,E.Androulaki,et al.A Secure DataDeduplication Scheme for Cloud Storage.International Conference on FinancialCryptography and Data Security,pp.99-118,2013)分别使用MLE和门限密码(thresholdcryptosystem)加密明文块,将其变换为多个随机的秘密共享发送至存储系统;当系统收到的共享个数超过阈值时,可恢复门限密码的密钥以及MLE密文块,并对MLE密文块执行重复数据删除操作。
最小哈希加密(见文献J.Li,c.Qin,P.P.C.Lee,et al.Information Leakage inEncrypted Deduplication via Frequency Analysis.Proceedings of the 47th IEEE/IFIP International Conference on Dependable Systems and Networks,2017)将若干相邻明文块聚集形成数据段,并基于其中具有最小哈希值的明文块生成密钥,应用于该数据段内所有明文块;由于Broder定理(见文献A.Z.Broder.On theresemblance andContainment of Documents.Compression and Complexity of SEQUENCES,pp.21-29,1997),大多数相同的明文块都采用了相同密钥而被加密为相同密文块,从而支持重复数据删除。
随机MLE、交互式MLE、分层加密可提供语义安全保障(即将相同的明文块被加密为“随机的”密文块);最小哈希加密,尽管为相似数据段仍然产生相同密钥,但存在于不同数据段的少量重复明文块会被不同密钥加密,这改变了密文块的频率分布,经验表明该方案可以缓解频率分析。
尽管如此,现有技术存在如下缺陷:
(1)基于低效率的底层密码方案
随机MLE和交互式MLE使用了复杂性较高的理论密码方案(例如非交互性零知识证明和全同态加密),难以应用在真实系统中;分层加密所采用的门限密码须基于公钥密码系统构造,在加密海量明文块时,效率远远低于对称密码系统。
(2)仅提供有限的安全性保障
最小哈希加密的重复数据删除有效性建立在文件相似性假设之上,对于不具备相似性的文件,其重复数据删除效果较低。更重要的是,数据段中具有最小哈希值的明文块往往仅具有有限的随机性(否则,将无法执行重复数据删除),因此,最小哈希加密难以针对频率分析提供足够的安全性保证。
(3)缺乏可配置性
现有方案均未提供可配置机制,难以量化地平衡数据存储效率和抗频率分析能力。例如,最小哈希加密基于文件特征(例如数据段中具有最小哈希值的明文块)产生密钥,加密过程的变量仍然依赖输入文件,无法自主控制产生的密文块在重复数据删除系统的存储效率。
发明内容
本发明的目的在于:提供了一种可调节加密重复数据删除方法,解决现有加密重复数据删除系统中的存储效率与抗频率分析的量化及平衡问题。
本发明采用的技术方案如下:
一种可调节加密重复数据删除方法,包括:客户端、密钥服务器,客户端可以是多个;
客户端,提供加密重复数据删除机制下的文件存储和访问接口,计算明文块M的密钥K;
密钥服务器,配置平衡参数t,维护系统全局秘密s,估算明文块M的频率f;
步骤如下:
步骤S1,密钥服务器配置平衡参数t,并维护系统全局秘密s;
步骤S2,密钥服务器估算明文块M的频率f;
步骤S3,密钥服务器计算中间参数x,中间参数x的计算公式为:
Figure BDA0002386507700000031
其中f为明文块M的频率,t为平衡参数,
Figure BDA0002386507700000032
返回不超过f/t的最大整数;
步骤S4,密钥服务器计算备选密钥种子kx,生成备选密钥种子集合{k0,k1,k2,...,kx},并从备选密钥种子集合中随机选择密钥种子k返回至客户端,
备选密钥种子kx的计算公式为:kx=H(s||P||H1(M)||H2(M)||…||Hr(M)||x),其中,s为系统全局秘密,P为明文块M的指纹,H()为哈希函数,x为中间参数,||连接前后相应对象;
步骤S5,客户端计算明文块M的密钥K,密钥K的计算公式为:K=H(k||P),其中,k为密钥种子,P为明文块M的指纹,||连接前后相应对象。
优选,步骤S2中,估算明文块M的频率f的具体步骤如下:
步骤S21,密钥服务器初始化CM-Sketch为r×w二维数组,二维数组的每个单元为一个计数器,初始值置0;配置r个独立的哈希函数{Hi()},Hi()为将任意长度输入映射为二维数组第i行的某一个计数器,i={1,2,...,w};
步骤S22,客户端计算各Hi(M),并发送至密钥服务器,这里i={1,2,...,r};
步骤S23,密钥服务器根据接收的r个{Hi(M)},将对应的计数器数值加1,并估算明文块M的频率f为所有Hi(M)对应的计数器的最小数值。
平衡参数t可以为自行设置的一个固定值,也可以基于某个/些参数自动生成。
优选地,步骤S1中,平衡参数t为自行设定的一个固定值,且t∈[50,100]。
优选地,步骤S1中,平衡参数t自动设定,具体步骤为:
步骤S11,密钥服务器配置存储膨胀系数b;
步骤S12,密钥服务器建立优化问题,使用信息论方法KLD表征密文明文块的频率分布和均匀分布之间的差异,具体为:
设n为明文块个数,fi为第i个明文块的频率,且fn≥fn-1≥…≥f1;设
Figure BDA0002386507700000041
为对应的fi *的概率密度函数,其中fi *为对应的第i个密文块的频率,n*=n×b,i为下标变量,
则:
Figure BDA0002386507700000042
在此基础上,优化问题将求解
Figure BDA0002386507700000043
并满足如下目标和约束,
目标:最小化KLD;
受限于:①
Figure BDA0002386507700000044
②任意1≤i≤n,fi *为第i个密文块的频率,fi为第i个明文块的频率,且fi *和fi为整数,0≤fi *≤fi
步骤S13,密钥服务器求解优化问题,得出
Figure BDA0002386507700000045
以及平衡参数t,具体为:
根据单纯形算法获得求解公式
Figure BDA0002386507700000046
其中下标m是满足
Figure BDA0002386507700000047
的最大整数;由于fn≥fn-1≥…≥f1,以上求解确保了
Figure BDA0002386507700000048
将t设置为
Figure BDA0002386507700000049
中的最大频率,即
Figure BDA00023865077000000410
为不小于
Figure BDA00023865077000000411
的最小整数。
本发明的主要具有如下好处:
本发明可以自主平衡存储效率与抗频率分析能力。随着检测到更多的明文块M的重复块,其频率f将逐渐积累,重复副本的密钥也将随着整数
Figure BDA00023865077000000412
的增大而更新。因此。可以通过调节t来为明文块M的副本产生不同的密钥。当t=1时,将为明文块M的每个副本产生一个不同的K,本发明将简化为SKE,提供语义安全保障;如果t→∞,则明文块M的所有副本具有相同的K,此时,本发明方法简化为MLE,获得最大化重复数据删除存储效率。
本发明可以避免始终为相同文件(视为若干个明文块组成的序列)产生相同的若干密文块,为数据加密增加不确定性。当明文块M具有更多重复副本(即f增加)时,明文块M的最近副本将基于之前使用过的{k0,k1,...,kx}中的某个旧密钥种子产生的密钥加密,因此,本发明允许某些副本被相同的密钥种子保护,以支持重复数据删除。同时,由于密钥种子的选择具有概率性,随着f增加,可以选择更多的备选密钥种子,从而将相同文件加密为可能不同的密文块序列。
本发明中,在估算明文块M的频率f时采用基于CM-Sketch统计技术,其降低了用于统计明文块频率的内存使用量,且频率估计误差已被证明是有限的;近似的频率估计有助于保护明文块信息,防止密钥服务器识别明文块M,这是因为每个Hi()是短哈希函数(shorthash function),仅返回1到w之间的计数器索引,由于w通常比指纹值范围(例如0~232)小,因此Hi()会导致哈希冲突(即多个不同明文块被映射为相同的短哈希值),密钥服务器无法基于短哈希推测原始明文块,从而解决明文块频率统计的安全性问题。
本发明中,在配置平衡参数t时采用的参数自动设定技术为t的配置提供友好接口,允许以存储膨胀系数(表征了本方法为了抵抗频率泄露导致的物理存储开销与最大化重复数据删除后的物理存储开销的比值)为输入,避免直接调控抽象的系统级参数。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是FSL数据集KLD的示意图;
图2是FSL数据集存储膨胀率的示意图;
图3是MS数据集KLD的示意图;
图4是MS数据集存储膨胀率的示意图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
一种可调节加密重复数据删除方法,致力于解决现有加密重复数据删除系统中明文块频率泄漏问题,通过自动化参数配置技术,配置能够负担的存储膨胀开销比率(以抵御频率泄漏);通过基于CM-Sketch的明文块频率统计技术,对输入文件的明文块频率进行实时估计;通过密钥概率生成技术,安全地为明文块产生对应密钥,应用于数据加密。
该方法主要应用于云存储,在降低存储服务提供商维护成本的同时,提高存储数据安全性。具体地,在云存储的用户端部署客户端支持数据读写;在云端部署密钥服务器和存储服务器用于管理密钥和远端数据。
该方法基于服务器辅助MLE系统架构,其包括客户端、密钥服务器,还可以包括存储服务器;
客户端,可设置多个,提供加密重复数据删除机制下的文件存储和访问接口,计算明文块M的密钥K;
密钥服务器,配置存储膨胀系数b,配置平衡参数t,维护系统全局秘密s,估算明文块M的频率f;
存储服务器,为客户端提供外包的重复数据删除存储服务。
具体步骤如下:
该方法的具体步骤为:
步骤S1,密钥服务器配置平衡参数t,并维护系统全局秘密s,其中,平衡参数t可以是自行设定的固定值,也可以是根据某一/些参数进行自动设定。
若平衡参数t为固定值,则t∈[50,100],平衡参数t为50至100中的任一值。
若平衡参数t采用自动设定,则设定的具体步骤为:
步骤S11,密钥服务器配置存储膨胀系数b;
步骤S12,密钥服务器建立优化问题,使用信息论方法KLD表征密文明文块的频率分布和均匀分布之间的差异,具体为:
设n为明文块个数,fi为第i个明文块的频率,且fn≥fn-1≥…≥f1;设
Figure BDA0002386507700000061
为对应的fi *的概率密度函数,其中fi *为对应的第i个密文块的频率,n*=n×b,i为下标变量,
则:
Figure BDA0002386507700000062
在此基础上,优化问题将求解
Figure BDA0002386507700000063
并满足如下目标和约束,
目标:最小化KLD;
受限于:①
Figure BDA0002386507700000064
②任意1≤i≤n,fi *为第i个密文块的频率,fi为第i个明文块的频率,且fi *和fi为整数,0≤fi *≤fi
步骤S13,密钥服务器求解优化问题,得出
Figure BDA0002386507700000071
以及平衡参数t,具体为:
根据单纯形算法获得求解公式
Figure BDA0002386507700000072
其中下标m是满足
Figure BDA0002386507700000073
的最大整数;由于fn≥fn-1≥…≥f1,以上求解确保了
Figure BDA0002386507700000074
将t设置为
Figure BDA0002386507700000075
中的最大频率,即
Figure BDA0002386507700000076
为不小于
Figure BDA0002386507700000077
的最小整数。
步骤S2,密钥服务器估算明文块M的频率f;
其中,估算明文块M的频率f的具体步骤如下:
步骤S21,密钥服务器初始化CM-Sketch为r×w二维数组,二维数组的每个单元为一个计数器,初始值置0:配置r个独立的哈希函数{Hi()},Hi()为将任意长度输入映射为二维数组第i行的某一个计数器,i={1,2,...,w};
步骤S22,客户端计算各Hi(M),并发送至密钥服务器,这里i={1,2,...,r};
步骤S23,密钥服务器根据接收的r个{Hi(M)},将对应的计数器数值加1,并估算明文块M的频率f为所有Hi(M)对应的计数器的最小数值。
步骤S3,密钥服务器计算中间参数x,中间参数的计算公式为:
Figure BDA0002386507700000078
其中f为明文块M的频率,t为平衡参数,
Figure BDA0002386507700000079
返回不超过f/t的最大整数;
步骤S4,密钥服务器计算备选密钥种子kx,生成备选密钥种子集合{k0,k1,k2,...,kx},并从备选密钥种子集合中随机选择密钥种子k返回至客户端,
备选密钥种子kx的计算公式为:kx=H(s||P||h1(M)||h2(M)||…||hr(M)||x),其中,s为系统全局秘密,P为明文块M的指纹,H()为哈希函数,x为中间参数,||连接前后相应对象;
步骤S5,客户端计算明文块M的密钥K,密钥K的计算公式为:K=H(k||P),其中,k为密钥种子,P为明文块M的指纹,||连接前后相应对象。
实施例
本实施例将对比分析基于本发明方法实现的可调节重复数据删除(tunableencrypted deduplication,简称TED)与现有加密方法。具体地,在对比分析中考虑如下方案:①MLE,使用各个明文块的哈希值作为密钥;②SKE,为每个明文块选择随机密钥;③MinHash Encryption(最小哈希加密),将数据段中所有明文块的最小哈希值作为本数据段中所有明文块的密钥;④BTED(basic TED),不应用自动参数设定的可调节加密重复数据删除;⑤FTED(full TED),完整应用三项关键技术的可调节加密重复数据删除。
本实施例将基于两种真实数据集FSL和MS验证本发明方法TED的有效性。
FSL数据集(http://tracer.filesystems.org/)是由石溪大学的文件系统和存储实验室(FSL)收集的2011年到2015年期间39个用户文件系统镜像的日常备份。本实施例采用了2013年1月22日至6月17日(即1月22日,2月22日,3月22日,4月22日,5月17日和6月17日)期间九个用户共计42个文件系统备份快照。数据集总共包含3.08TB逻辑数据。
MS数据集是由微软收集的Windows文件系统快照。本实施例采用了其中30个快照,每个快照的大小约为100GB,总共包含3.91TB逻辑数据。
本实施例的验证指标包括:①存储膨胀率,以精确重复数据删除对应的密文存储空间为基准,各个加密方法实施后密文块的实际存储空间开销与基准的比值,存储膨胀率越低则说明该加密方法的重复数据删除效率越高;②KLD,为不同加密方式下密文块的频率分布和均匀分布之间的差异度量,用于衡量数据频率的保护程度,KLD越低则数据频率保护程度越高。
附图1-4显示了实施例在95%置信区间情况下的分析结果。MLE实现了精确重复数据删除(即其存储膨胀率始终为1),但由于确定性加密导致KLD最高。SKE的KLD接近于零,但由于随机加密不支持重复数据删除,导致存储膨胀率最大。最小哈希加密,BTED和FTED实现了KLD和存储开销的平衡。例如,在FSL和MS数据集中,当设定存储膨胀系数b=1.2时,FTED分别将MLE的KLD降低了84.7%和76.8%,并将SKE的存储开销降低了37.0%和60.6%。
与最小哈希加密相比,BTED和FTED均可实现较低的KLD和存储开销。例如,在FSL和MS数据集中,最小哈希加密的KLD分别为1.35和1.15,实际存储膨胀率为1.24和1.61;而所有BTED和FTED方案的相应KLD均低于0.56和0.85,并且实际存储膨胀率最多仅为1.11和1.17。
进一步比较BTED和FTED。虽然随着t增大,BTED会具有较大KLD和较小存储膨胀率(反之亦然),但其实际存储膨胀率难以通过t进行配置。相反,FTED提供了一种控制实际存储膨胀率的有效方法。当b从1.05增至1.2时,FTED在FSL数据集中的实际存储膨胀率从1.04增加到1.11,在MS数据集中从1.05增加到1.17。需要注意的是,当b较大时,FSL数据集中的实际存储膨胀率小于设定的b(例如,当b=1.2时实际存储膨胀率仅为1.11),这是因为某些FSL文件快照的重复块很少,能够达到的最大存储膨胀即小于b。

Claims (4)

1.一种可调节加密重复数据删除方法,其特征在于,包括:
客户端,提供加密重复数据删除机制下的文件存储和访问接口,计算明文块M的密钥K;
密钥服务器,配置平衡参数t,维护系统全局秘密s,估算明文块M的频率f;
步骤如下:
步骤S1,密钥服务器配置平衡参数t,并维护系统全局秘密s;
步骤S2,密钥服务器估算明文块M的频率f;
步骤S3,密钥服务器计算中间参数x,中间参数x的计算公式为:其中f为明文块M的频率,t为平衡参数,
Figure FDA0002386507690000012
返回不超过f/t的最大整数;
步骤S4,密钥服务器计算备选密钥种子kx,生成备选密钥种子集合{k0,k1,k2,...,kx},并从备选密钥种子集合中随机选择密钥种子k返回至客户端,
备选密钥种子kx的计算公式为:kx=H(s||P||H1(M)||H2(M)||…||hr(M)||x),其中,s为系统全局秘密,P为明文块M的指纹,H()为哈希函数,x为中间参数,||连接前后相应对象;
步骤S5,客户端计算明文块M的密钥K,密钥K的计算公式为:K=H(k||P),其中,k为密钥种子,P为明文块M的指纹,||连接前后相应对象。
2.如权利要求1所述的一种可调节加密重复数据删除方法,其特征在于;步骤S2中,估算明文块M的频率f的具体步骤如下:
步骤S21,密钥服务器初始化CM-Sketch为r×w二维数组,二维数组的每个单元为一个计数器,初始值置0;配置r个独立的哈希函数{Hi()},Hi()为将任意长度输入映射为二维数组第i行的某一个计数器,i={1,2,...,w};
步骤S22,客户端计算各Hi(M),并发送至密钥服务器,这里i={1,2,...,r};
步骤S23,密钥服务器根据接收的r个{Hi(M)},将对应的计数器数值加1,并估算明文块M的频率f为所有Hi(M)对应的计数器的最小数值。
3.如权利要求1所述的一种可调节加密重复数据删除方法,其特征在于;步骤S1中,平衡参数t为固定值,t∈[50,100]。
4.如权利要求1所述的一种可调节加密重复数据删除方法,其特征在于;步骤S1中,平衡参数t自动设定,具体步骤为:
步骤S11,密钥服务器配置存储膨胀系数b;
步骤S12,密钥服务器建立优化问题,使用信息论方法KLD表征密文明文块的频率分布和均匀分布之间的差异,具体为:
设n为明文块个数,fi为第i个明文块的频率,且fn≥fn-1≥…≥f1;设
Figure FDA0002386507690000013
为对应的fi *的概率密度函数,其中fi *为对应的第i个密文块的频率,n*=n×b,i为下标变量,
则:
Figure FDA0002386507690000021
在此基础上,优化问题将求解
Figure FDA0002386507690000022
并满足如下目标和约束,
目标:最小化KLD;
受限于:①
Figure FDA0002386507690000023
②任意1≤i≤n,fi *为第i个密文块的频率,fi为第i个明文块的频率,且fi *和fi均为整数,0≤fi *≤fi
步骤S13,密钥服务器求解优化问题,得出
Figure FDA0002386507690000024
以及平衡参数t,具体为:
根据单纯形算法获得求解公式
Figure FDA0002386507690000025
其中下标m是满足
Figure FDA0002386507690000026
的最大整数;由于fn≥fn-1≥…≥f1,以上求解确保了
Figure FDA0002386507690000027
将t设置为
Figure FDA0002386507690000028
中的最大频率,即
Figure FDA0002386507690000029
Figure FDA00023865076900000210
为不小于
Figure FDA00023865076900000211
的最小整数。
CN202010100701.8A 2020-02-18 2020-02-18 一种可调节加密重复数据删除方法 Active CN111338572B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010100701.8A CN111338572B (zh) 2020-02-18 2020-02-18 一种可调节加密重复数据删除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010100701.8A CN111338572B (zh) 2020-02-18 2020-02-18 一种可调节加密重复数据删除方法

Publications (2)

Publication Number Publication Date
CN111338572A true CN111338572A (zh) 2020-06-26
CN111338572B CN111338572B (zh) 2021-09-14

Family

ID=71181551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010100701.8A Active CN111338572B (zh) 2020-02-18 2020-02-18 一种可调节加密重复数据删除方法

Country Status (1)

Country Link
CN (1) CN111338572B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102594824A (zh) * 2012-02-21 2012-07-18 北京国泰信安科技有限公司 基于多重安全保护机制的电子文档安全分发方法
US20150154411A1 (en) * 2012-04-23 2015-06-04 International Business Machines Corporation Preserving redundancy in data deduplication systems by encryption
CN105868305A (zh) * 2016-03-25 2016-08-17 西安电子科技大学 一种支持模糊匹配的云存储数据去重复方法
CN108200172A (zh) * 2018-01-03 2018-06-22 西安电子科技大学 一种支持安全数据去重与删除的云存储系统及方法
CN110109617A (zh) * 2019-04-22 2019-08-09 电子科技大学 一种加密重复数据删除系统中的高效元数据管理方法
CN110637441A (zh) * 2017-05-19 2019-12-31 国际商业机器公司 应用于数据重复数据删除的加密密钥生成

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102594824A (zh) * 2012-02-21 2012-07-18 北京国泰信安科技有限公司 基于多重安全保护机制的电子文档安全分发方法
US20150154411A1 (en) * 2012-04-23 2015-06-04 International Business Machines Corporation Preserving redundancy in data deduplication systems by encryption
CN105868305A (zh) * 2016-03-25 2016-08-17 西安电子科技大学 一种支持模糊匹配的云存储数据去重复方法
CN110637441A (zh) * 2017-05-19 2019-12-31 国际商业机器公司 应用于数据重复数据删除的加密密钥生成
CN108200172A (zh) * 2018-01-03 2018-06-22 西安电子科技大学 一种支持安全数据去重与删除的云存储系统及方法
CN110109617A (zh) * 2019-04-22 2019-08-09 电子科技大学 一种加密重复数据删除系统中的高效元数据管理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHUAN QIN,JINGWEI LI,PATRICK P. C. LEE: "The Design and Implementation of a Rekeying-Aware Encrypted", 《ACM TRANSACTIONS ON STORAGE》 *

Also Published As

Publication number Publication date
CN111338572B (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
Ateniese et al. Provable data possession at untrusted stores
Li et al. Secure deduplication with efficient and reliable convergent key management
Naor et al. Distributed pseudo-random functions and KDCs
Zhou et al. SecDep: A user-aware efficient fine-grained secure deduplication scheme with multi-level key management
Raykova et al. Secure anonymous database search
González-Manzano et al. An efficient confidentiality-preserving proof of ownership for deduplication
Di Pietro et al. Proof of ownership for deduplication systems: a secure, scalable, and efficient solution
CN110213042A (zh) 一种基于无证书代理重加密的云数据去重方法
EP2495908A1 (en) Data processing device
Li et al. CSED: Client-side encrypted deduplication scheme based on proofs of ownership for cloud storage
CN101917403B (zh) 一种用于密文存储的分布式密钥管理方法
CN103763362A (zh) 一种安全的分布式重复数据删除方法
CN108776758B (zh) 一种雾存储中支持动态所有权管理的块级数据去重方法
CN110413652B (zh) 一种基于边缘计算的大数据隐私化检索方法
EP2787681A1 (en) Data processing device, data processing method, and program
Wen et al. A verifiable data deduplication scheme in cloud computing
CN110175169B (zh) 一种加密数据去重方法、系统及相关装置
CN108810063A (zh) 一种多云存储环境下数据的安全分发和修复方法、系统及介质
CN110750797A (zh) 基于组合加密的云数据库加密方法
EP2947813B1 (en) Decryption service providing device, processing device, safety evaluation device, program, and recording medium
Tchernykh et al. Towards mitigating uncertainty of data security breaches and collusion in cloud computing
Peng et al. Autorep: Automatic relu replacement for fast private network inference
CN110968452A (zh) 一种智能电网云存储中可安全去重的数据完整性验证方法
CN104660705B (zh) 一种网站数据库后台处理方法
Sun et al. Tapping the potential: Secure chunk-based deduplication of encrypted data for cloud backup

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant