CN108416221B - 一种云环境中安全的相似数据拥有证明方案 - Google Patents

一种云环境中安全的相似数据拥有证明方案 Download PDF

Info

Publication number
CN108416221B
CN108416221B CN201810059859.8A CN201810059859A CN108416221B CN 108416221 B CN108416221 B CN 108416221B CN 201810059859 A CN201810059859 A CN 201810059859A CN 108416221 B CN108416221 B CN 108416221B
Authority
CN
China
Prior art keywords
data
user
cloud server
cloud
possession
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810059859.8A
Other languages
English (en)
Other versions
CN108416221A (zh
Inventor
姜涛
袁浩然
陈晓峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201810059859.8A priority Critical patent/CN108416221B/zh
Publication of CN108416221A publication Critical patent/CN108416221A/zh
Application granted granted Critical
Publication of CN108416221B publication Critical patent/CN108416221B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

本发明属于信息检索及数据库结构技术领域,公开了一种云环境中安全的相似数据拥有证明方案,该方案可以在云服务器在不获得用户数据的前提下计算出数据w'和数据w的汉明距离。用户C和云服务器S分别以密文数据cw'和cw作为输入;如果用户C声称拥有数据w'的标签tw'与存储在云服务器上的数据cw的标签tw相似,则用户C需要向云服务器S证明dis(cw',cw)≤t,t是设置用于判断数据是否相似的参数;disHam(a,b)表示a和b的汉明距离;云服务器S仅获得密文数据cw'和cw的汉明距离且不能获得数据w'的任何信息,用户C不能获得数据w的任何信息。本发明可以让云服务器有效的验证用户的数据是否与云服务器存储的数据是否相似。只有当云服务器验证用户确实拥有与服务器相似的数据的时候,才允许用户访问存储在云服务器上的数据。

Description

一种云环境中安全的相似数据拥有证明方案
技术领域
本发明属于信息检索;及其数据库结构技术领域,尤其涉及一种云环境中安全的相似数据拥有证明方案。
背景技术
云计算是全球搜索巨头Google在2007年提出的全新概念,这一概念提出之后,在IBM、谷歌、亚马逊等IT巨头的大力推动下,如今云计算已经成为了产业界,学术界和政府关注的焦点。云计算是一种具有动态延展能力的计算方式,它可以看作是现有的分布式计算、并行处理计算、网格计算等概念的延伸和发展应用,并将其作为一种“基础设施”出现在人们的视野。通俗来讲,云计算是以用户为中心的一种计算服务。这种服务就如同天上的“云”一般,用户的不同需求决定“云”的“规模”、“形状”和“配置”。用户终端设备的计算和存储能力有限,而拥有近似无限资源的云就为用户提供了很多便利。云计算平台能在极短时间内处理非常大数量级的信息,进而把资源(包括计算资源、存储空间及网络带宽等)以服务的形式用互联网提供给需要此类资源的个体或公司,大大减轻了资源受限用户对软件管理及硬件维护的负担,从而彻底改变了传统IT行业的架构和运行方式。然而云计算在提供多种高效弹性的服务的同时,也遇到很多挑战和亟需处理的问题。随着数据的爆发式增长,根据国际数据公司(IDC)的最新统计分析,全球产生和复制的数据以每2年翻一番的速度激增,到2020年,全球数据总量将达到44ZB。这些大量的数据将会给云服务器带来了前所未有的挑战。另一方面,存储在服务器中大量的冗余数据就是限制云存储发展的另一大瓶颈。根据EMC的调查报告显示,随着云端数据的快速增长,云存储中的冗余数据在备份应用中达到80%以上,在文件系统中已经达到60%以上,这些冗余数据消耗着大量的存储资源和管理资源。这就不可避免地给服务器带来了巨大的数据存储开销,并造成网络传输带宽的浪费。因此,如何通过删除重复数据从而保证数据存储的高效性成为了亟待解决的问题。为了解决上述问题,数据去重技术应运而生,通过数据去重技术可以消除数据冗余,相同文件只保留一个物理副本,从而有效降低用户端上传数据耗费的带宽及节省服务器端的存储空间。对于云计算平台而言,数据去重不仅可以减少存储时付出的硬件成本,还可以提升存储空间的利用率,提高访问效率。数据去重存储技术目前广泛应用于商业云存储及数据备份服务,例如Dropbox、Mozy和Memopal等商业存储中。然而在去重技术节省用户和云服务器大量的存储与管理资源的同时,出现了许多安全问题。其中最严重的问题之一就是标签欺骗攻击。标签欺骗攻击指的是敌手并不拥有数据,而服务器只是使用简单的询问数据的标签的方式判断一个新的用户是否拥有与服务器存储的数据是否相同。如果标签一致,则新的用户通过服务器的验证,云服务器就允许新的用户访问存储在云服务器上的数据而不需要用户再次上传数据。因此,敌手可以通过穷举方法或者各种其他攻击方案获得数据的标签,从而获得云服务器数据的访问权限。为了解决这一问题,许多数据拥有证明方案被提出,使用数据拥有证明方案可以让云服务器有效验证新的用户是否拥有服务器存储的数据。只有当用户通过服务器的数据拥有证明之后,用户才允许访问存储在云服务器上的数据。然而,现有的方案只针对于相同数据的拥有证明,并没有方案可以实现相似数据的拥有证明。实际上,对密文数据进行相似数据拥有证明是困难的,这是因为用户的数据通常以密文的形式存储在云服务器上,如果使用传统加密方案,不同数据的密钥选择是随机的,因此即使是相似的数据加密之后也会获得相差度很大的密文数据,云服务器就无法判断这些密文数据的明文是否是相似的,这也就阻碍了相似数据拥有证明的实现。如果相似数据拥有证明方案可以实现,则云服务器将进一步提升数据去重的效率,即可以实现相似数据的去重,这将进一步提升云服务器存储空间的利用率并减少带宽浪费。
综上所述,现有技术存在的问题是:
(1)现有的数据拥有证明方案仅能支持相同数据的拥有证明,不能支持相似数据的拥有证明。
(2)如果直接使用现有的数据拥有证明方案,云服务器无法判断两个密文数据的明文是否是相似的
(3)如果云服务器仅通过验证数据标签的方案判断用户是否拥有数据,则存在标签欺骗攻击,用户可以通过穷举等攻击方案获得云服务器数据的访问权限。
解决上述技术问题的难度和意义:
(1)如果相似数据拥有证明方案可以实现,则云服务器将进一步提升数据去重的效率,即可以实现相似数据的去重。
(2)通过实现相似数据拥有证明方案,可以防止恶意敌手通过标签欺骗攻击获得不应该获得数据的访问权限。
(3)服务器只能验证存储在服务器的数据与用户的数据是否是相似的,而不能获得用户数据。
发明内容
针对现有技术存在的问题,本发明提供了一种云环境中安全的相似数据拥有证明方案。
本发明是这样实现的,一种云环境中安全的相似数据拥有证明方案,所述云环境中安全的相似数据拥有证明方案计算出数据w'和数据w的实际距离;用户C和云服务器S分别以密文数据cw'和cw作为输入;如果用户C声称拥有数据w'的标签tw'与存储在云服务器上的数据cw的标签tw相似,则用户C需要向云服务器S证明dis(cw',cw)≤t,t是设置用于判断数据是否相似的参数;disHam(a,b)表示a和b的汉明距离;通过云环境中安全的相似数据拥有证明方案,云服务器S仅获得密文数据cw'和cw的汉明距离且不能获得数据w'的任何信息,用户C不能获得数据w的任何信息;相似数据拥有证明定义为下面的两方交互式协议:
FuzzyPow:[C:cw';S:cw]→[C:⊥;S:disHam(cw,cw')]。
进一步,所述云环境中安全的相似数据拥有证明方案通过统计
Figure BDA0001554995130000041
的个数来计算汉明距离;用户C和云服务器S分别拥有输入串cw'=(cw'[1],...,cw'[|w'|])和串cw=(cw[1],...,cw[|w|]);用户C作为发送者生成N个随机数
Figure BDA0001554995130000042
作为盲化因子并与云服务器S发起N个不经意传输协议。
进一步,所述云环境中安全的相似数据拥有证明方案当用户C的输入为0时,令不经意传输的输出值为ri+cw'[i];当用户C的输入为1时,令不经意传输的输出值为
Figure BDA0001554995130000043
如果cw[i]=0,那么有
Figure BDA0001554995130000044
如果cw[i]=1,那么有
Figure BDA0001554995130000045
云服务器S是N轮不经意传输协议的接收者,输入cw=(cw[1],...,cw[|w|])得到对于i=1,...,N的值
Figure BDA0001554995130000046
然后云服务器将所有的
Figure BDA0001554995130000047
相加得到
Figure BDA0001554995130000048
最后,用户发送∑r给云服务器S,云服务器S的最终输出为disHam(cw',cw)=∑t-∑r;如果设置的最大汉明距离为t且disHam(cw',cw)≤t,将得到数据cw'和cw是相似数据且用户C的确拥有与云服务器存储的数据cw相似的数据cw'
进一步,所述云环境中安全的相似数据拥有证明方案具体包括:
协议输入:
用户C输入长度为|cw'|的串cw'=(cw'[1],...,cw'[|w'|]),云服务器S输入长度为|cw|的串cw=(cw[1],...,cw[|w|]),|cw'|=|cw|=N;
协议输出:
云服务器S获得dis(cw',cw),用户C不获得任何信息;
协议:
用户C生成N个随机数
Figure BDA0001554995130000049
并且计算
Figure BDA00015549951300000410
对于每一个i=1,...,N,用户C作为发送者,服务器S作为接受者运行不经意传输协议OT1 2
a.用户C的输入为
Figure BDA0001554995130000052
b.云服务器S选择比特cw[i];
c.云服务器S最终获得
Figure BDA0001554995130000053
服务器S输出
Figure BDA0001554995130000054
用户C发送∑r给服务器S;
服务器S通过计算∑t-∑r得到disHam(cw',cw)。
本发明的另一目的在于提供一种所述云环境中安全的相似数据拥有证明方案的概率性相似数据拥有证明方案,所述概率性相似数据拥有证明方案中|cw'|=|cw|=N,判断在相同位置用户C和云服务器S的比特值是否相同;云服务器S不再对所有的密文数据逐比特验证用户的密文数据,需要验证的比特个数的总量为θ,γ←{0,1}λ是云服务器S发送给用户C的随机数,λ为安全参数,h是一个伪随机置换定义如下:
Figure BDA0001554995130000055
协议的输入:用户和云服务器以安全参数λ,比特串的长度N,需要验证用户密文数据的比特数θ,随机数γ作为输入;
协议的输出:随机选择的θ个比特的位置{p1,...,pθ};
协议:对于i从1到θ,计算随机位置pi=hγ(i);
在得到θ个比特位置的汉明距离disHam(cw',cw)之后,云服务器通过计算
Figure BDA0001554995130000056
估算整个密文的汉明距离;如果disHam(cw',cw)≤t,密文数据cw'和密文数据cw是相似的,云服务器S将允许用户C访问存储在云服务器上的密文数据。
本发明的另一目的在于提供一种所述云环境中安全的相似数据拥有证明方案的云存储系统,所述云存储系统由一个云存储服务器S和一组用户Cs组成;用户希望在云服务器S上存储敏感数据;S和Cs要实现对上传的密文数据进行相似数据拥有证明。
本发明的另一目的在于提供一种应用所述云环境中安全的相似数据拥有证明方案的云服务器。
综上所述,本发明的优点及积极效果为:本发明可以让云服务器有效地验证用户的数据与云服务器存储的数据是否相似,并且在验证过程中不能获得用户数据的任何信息。只有当云服务器验证用户确实拥有与服务器相似的数据的时候,才允许用户访问存储在云服务器上的数据。
本发明针对云环境中去重技术实现所面临的标签欺骗问题,提出了两个相似数据拥有证明方案。可以有效的使云服务器验证用户是否拥有与云服务器存储的密文数据相同的密文数据。使得用户只有在通过服务器的数据拥有证明协议之后才允许用户访问相应的密文数据,进而保证了数据的安全性。然而由于数据量不断变大,如果对所有的数据进行验证将消耗大量的计算与通信开销,为了解决这一问题并进一步提高相似数据拥有证明方案的效率,本发明提出了概率性相似数据拥有证明方案。概率性相似数据拥有证明方案通过使用伪随机置换让云服务器随机的选择一定数量的随机比特对用户的密文数据进行验证。通过概率性的验证算法,用户与云服务器的计算开销和通信开销将大大降低,更具有实用性。
附图说明
图1是本发明实施例提供的云环境中安全的相似数据拥有证明方案流程图。
图2是本发明实施例提供的云环境中安全的相似数据拥有证明方案实现的结构框图。
图3是本发明实施例提供的相似数据拥有证明方案用户与服务器计算开销示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
随着云计算技术的快速发展,越来越多的用户和企业倾向于将数据外包存储在云服务器上。在外包计算模型下,资源受限的用户可以通过按需付费的方式(pay-per-use-manner)来购买云计算服务商提供的无尽的计算和存储资源,在用户享受海量存储服务的同时大大减轻了用户端软硬件管理和维护的负担。通过采用不经意传输协议实现数据拥有证明。本发明的方案可以使云服务器授予用户访问权之前有效的验证用户是否拥有相似的数据。
如图1所示,本发明实施例提供的云环境中安全的相似数据拥有证明方案包括:
S101:用户和云服务器以密文数据作为输入,用户声称拥有数据的标签与存储在云服务器上的数据的标签相似,则用户需要向云服务器证明;
S102:汉明距离判断数据的相似度,云服务器仅获得密文数据的汉明距离且不能获得数据的任何信息,用户不能获得数据的任何信息。
下面结合附图对本发明的应用原理作进一步的描述。
1、系统模型
云存储系统由一个云存储服务器(S)和一组用户(Cs)组成,用户希望在云服务器S上存储敏感数据。为了保护数据的安全,Cs想要在上传数据之前加密其敏感的数据。为了减少S和Cs之间的存储开销和不必要的通信开销,S和Cs要实现对上传的密文数据进行相似数据去重。为了提高通信效率,如果Cs已经在S的数据库中存储了一些相似的数据,则只有第一个用户需要将数据的密文上传到S上。为了防止标签欺骗攻击,之后的用户如果希望访问存储在云服务器上的数据之前必须通过云服务器相似数据拥有证明。
2、预备知识
不经意传输协议
不经意传输协议是一个两方协议,协议有两个参与方:发送者S和接收者R。发送者S拥有一个隐私的消息并希望以50%的概率发送给接收者R,接收者R接收到消息的概率为50%,另外50%的概率什么也得不到。协议执行完成之后发送者S不能知道隐私的消息是否被接受者R接收到。不经意传输协议OT1 2的定义如下:
输入:发送者S发输入两个n长的比特串X0和X1,接受者R输入选择的一个比特b(b∈{0,1})。
输出:发送者S对比特b一无所知,接受者R只能获得一个比特串Xb,对另一个比特串X1-b一无所知。
3、相似数据拥有证明方案
相似数据拥有证明方案与数据拥有证明方案类似,然而传统的数据拥有证明方案通常使用哈希函数或者签名作为证据,这使得传统的数据拥有证明方案无法适用于相似数据的拥有证明方案中,原因是相似的数据即使是1比特数据不同,经过哈希函数或者签名运算之后生成的证据将截然不同。进而云服务器无法对相似的数据进行拥有证明。
为了实现相似数据的拥有证明,并且希望进行相似数据拥有证明的数据是密文数据,本发明要求密文数据必须使用异或加密算法对数据进行加密。然而如果直接使用密文进行相似数据拥有证明是不安全的。原因如下:假设两个相似数据w'和数据w的加密密钥分别是G(r)和G(r')且G(r)=G(r'),数据w'和数据w的密文分别是
Figure BDA0001554995130000081
Figure BDA0001554995130000082
假设用户拥有数据
Figure BDA0001554995130000083
为了与云服务器执行相似数据拥有证明将数据cw'发送给拥有数据
Figure BDA0001554995130000084
的云服务器,则服务器可以计算得到
Figure BDA0001554995130000085
这将泄露给云服务器数据w和数据w'不同的数据。
为了防止这种攻击,本发明提出了新的数据拥有证明方案,本发明的方案可以计算出数据w'和数据w的实际距离而且不泄露任何信息。相似数据拥有证明协议是一个交互协议,用户C和云服务器S分别以密文数据cw'和cw作为输入。如果用户C声称拥有数据w'的标签tw'与存储在云服务器上的数据cw的标签tw相似,则用户C需要向云服务器S证明dis(cw',cw)≤t,t是设置用于判断数据是否相似的参数。本发明在仅通过考虑汉明距离判断数据的相似度。disHam(a,b)表示a和b的汉明距离。最终,云服务器S仅获得密文数据cw'和cw的汉明距离且不能获得数据w'的任何信息,用户C不能获得数据w的任何信息。相似数据拥有证明方案可以定义为下面的两方交互式协议:
FuzzyPow:[C:cw';S:cw]→[C:⊥;S:disHam(cw,cw')];
在相似数据拥有证明协议中,通过统计
Figure BDA0001554995130000091
的个数来计算汉明距离。假设用户C和云服务器S分别拥有输入串cw'=(cw'[1],...,cw'[|w'|])和串cw=(cw[1],...,cw[|w|])。用户C作为发送者生成N个随机数
Figure BDA0001554995130000092
作为盲化因子并与云服务器S发起N个不经意传输协议。本发明需要说明的是,OT协议可以被改进以减少交互循环次数或者协议运行时间。一方面,协议可以通过一次发送所有比特的盲化因子的方案减少交互轮次。另一方面,由于输入数据的比特值是相互独立的,因此不经意传输协议可以运行多个线程来降低时间成本。对于第i个传输协议,接受者通过输入比特cw[i]得到
Figure BDA0001554995130000093
为了完成计算目标,当用户C的输入为0时,令不经意传输的输出值为ri+cw'[i];当用户C的输入为1时,令不经意传输的输出值为
Figure BDA0001554995130000094
事实上,如果cw[i]=0,那么有
Figure BDA0001554995130000095
如果cw[i]=1,那么有
Figure BDA0001554995130000096
云服务器S是N轮不经意传输协议的接收者,输入cw=(cw[1],...,cw[|w|])得到对于i=1,...,N的值
Figure BDA0001554995130000097
然后云服务器将所有的
Figure BDA0001554995130000098
相加得到
Figure BDA0001554995130000101
(其中
Figure BDA0001554995130000102
)。最后,用户发送∑r给云服务器S,云服务器S的最终输出为disHam(cw',cw)=∑t-∑r。如果设置的最大汉明距离为t且disHam(cw',cw)≤t,本发明将得到数据cw'和cw是相似数据且用户C的确拥有与云服务器存储的数据cw相似的数据cw'
4、相似数据拥有证明协议的细节构造如下:
协议输入:
用户C输入长度为|cw'|的串cw'=(cw'[1],...,cw'[|w'|]),云服务器S输入长度为|cw|的串cw=(cw[1],...,cw[|w|]),本发明假设|cw'|=|cw|=N。
协议输出:
云服务器S获得dis(cw',cw),用户C不获得任何信息。
协议:
用户C生成N个随机数
Figure BDA0001554995130000103
并且计算
Figure BDA0001554995130000104
对于每一个i=1,...,N,用户C作为发送者,服务器S作为接受者运行不经意传输协议OT1 2
a.用户C的输入为(ri+cw'[i];ri+cw'[i])。
b.云服务器S选择比特cw[i]。
c.云服务器S最终获得
Figure BDA0001554995130000106
服务器S输出
Figure BDA0001554995130000107
用户C发送∑r给服务器S。
服务器S通过计算∑t-∑r得到disHam(cw',cw)。
表1相似数据拥有证明协议
Figure BDA0001554995130000111
5、概率性相似数据拥有证明方案
为了进一步提高本发明相似数据拥有证明方案的效率,本发明同样构建了概率性相似数据拥有证明方案。概率性相似数据拥有证明方案适用于处理大规模数据。是在相似数据拥有证明协议的基础上使用取样技术进行实现的。本发明假设|cw'|=|cw|=N,判断在相同位置(例如cw'[i]和cw[i])用户C和云服务器S的比特值是否相同从而达到验证的目的。核心思想是云服务器S不再对所有的密文数据逐比特验证用户的密文数据,而是随机选择一定数量的比特位置,使用相似数据拥有证明方案验证这些随机选择位置上用户的密文数据和服务器的密文数据是否相似,从而达到概率性的验证。本发明定义需要验证的比特个数的总量为θ,γ←{0,1}λ是云服务器S发送给用户C的随机数,λ为安全参数,h是一个伪随机置换定义如下:
Figure BDA0001554995130000112
协议的输入:用户和云服务器以安全参数λ,比特串的长度N,需要验证用户密文数据的比特数θ,随机数γ作为输入。
协议的输出:随机选择的θ个比特的位置{p1,...,pθ}。
协议:对于i从1到θ,计算随机位置pi=hγ(i)。
在得到θ个比特位置的汉明距离disHam(cw',cw)之后,云服务器可以通过计算
Figure BDA0001554995130000121
估算整个密文的汉明距离。如果disHam(cw',cw)≤t,本发明认为密文数据cw'和密文数据cw是相似的,从而云服务器S将允许用户C访问存储在云服务器上的密文数据。
表2概率相似数据拥有证明协议
Figure BDA0001554995130000122
下面结合实验对本发明的应用效果作详细的描述。
表2详细的列出了相似数据拥有证明方案与概率性相似数据拥有证明方案的计算和通信开销。需要说明的是,相似数据拥有证明方案的通信开销相对较大,是数据大小的
Figure BDA0001554995130000124
倍。概率性相似数据拥有证明方案的通信开销取决于所选位的数量。
表3相似数据拥有证明方案的计算开销和通信开销
Figure BDA0001554995130000123
本发明通过使用编程语言C++对相似数据拥有证明方案进行了实现,本发明使用了免费的GMP库来实现SimHash算法。密码哈希算法和异或加密算法(SHA-256和异或加密算法)由OpenSSL库来实现。本发明在运行Linux 14.04的两台计算机上分别运行客户端和服务器应用程序,使用的计算机硬件配置为:1.70GHz Intel i5-3317U CPU,4GB内存。为了在局域网上进行实验,本发明实现了客户端与服务器之间的通信,并将这两台机器放在同一个区域。服务器和客户端之间的有线连接的通信带宽设置为10Mbps。
数据拥有证明方案的计算成本取决于不经意传输OT1 2的数量。本发明模拟的相似数据拥有证明协议中客户端和服务器的计算开销如图3所示。通过实验本发明可以看到用户与服务器的计算时间随着比特长度的增加线性增长。由于用户需要初始化N个随机数,因此用户的计算时间大于服务器的计算开销。在实际应用中,用户可以通过预计算或并行计算等优化方案进一步提高本发明方案的效率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种云环境中安全的相似数据拥有证明方法,其特征在于,所述云环境中安全的相似数据拥有证明方法计算出数据w'和数据w的实际距离;用户C和云服务器S分别以密文数据cw'和cw作为输入;如果用户C声称拥有数据w'的标签tw'与存储在云服务器上的数据cw的标签tw相似,则用户C需要向云服务器S证明dis(cw',cw)≤t,t是设置用于判断数据是否相似的参数;disHam(a,b)表示a和b的汉明距离;云服务器S仅获得密文数据cw'和cw的汉明距离且不能获得数据w'的任何信息,用户C不能获得数据w的任何信息;相似数据拥有证明定义为下面的两方交互式协议:
FuzzyPow:[C:cw';S:cw]→[C:⊥;S:disHam(cw,cw')]。
2.如权利要求1所述的云环境中安全的相似数据拥有证明方法,其特征在于,所述云环境中安全的相似数据拥有证明方法通过统计
Figure FDA0003005297870000014
的个数来计算汉明距离;用户C和云服务器S分别拥有输入串cw'=(cw'[1],...,cw'[|w'|])和串cw=(cw[1],...,cw[|w|]);用户C作为发送者生成N个随机数
Figure FDA0003005297870000011
作为盲化因子并与云服务器S发起N个不经意传输协议。
3.如权利要求1所述的云环境中安全的相似数据拥有证明方法,其特征在于,所述云环境中安全的相似数据拥有证明方法当用户C的输入为0时,令不经意传输的输出值为ri+cw'[i];当用户C的输入为1时,令不经意传输的输出值为
Figure FDA0003005297870000012
如果cw[i]=0,那么有
Figure FDA0003005297870000015
如果cw[i]=1,那么有
Figure FDA0003005297870000013
云服务器S是N轮不经意传输协议的接收者,输入cw=(cw[1],...,cw[|w|])得到对于i=1,...,N的值
Figure FDA0003005297870000026
然后云服务器将所有的
Figure FDA0003005297870000027
相加得到
Figure FDA0003005297870000021
最后,用户发送∑r给云服务器S,云服务器S的最终输出为disHam(cw',cw)=∑t-∑r;如果设置的最大汉明距离为t且disHam(cw',cw)≤t,将得到数据cw'和cw是相似数据且用户C的确拥有与云服务器存储的数据cw相似的数据cw'
4.如权利要求1所述的云环境中安全的相似数据拥有证明方法,其特征在于,所述云环境中安全的相似数据拥有证明方法具体包括:
协议输入:
用户C输入长度为|cw'|的串cw'=(cw'[1],...,cw'[|w'|]),云服务器S输入长度为|cw|的串cw=(cw[1],...,cw[|w|]),|cw'|=|cw|=N;
协议输出:
云服务器S获得dis(cw',cw),用户C不获得任何信息;
协议:
用户C生成N个随机数
Figure FDA0003005297870000022
并且计算
Figure FDA0003005297870000023
对于每一个i=1,...,N,用户C作为发送者,服务器S作为接受者运行不经意传输协议OT1 2
a.用户C的输入为
Figure FDA0003005297870000024
b.云服务器S选择比特cw[i];
c.云服务器S最终获得
Figure FDA0003005297870000028
服务器S输出
Figure FDA0003005297870000025
用户C发送∑r给服务器S;
服务器S通过计算∑t-∑r得到disHam(cw',cw)。
5.一种如权利要求1所述云环境中安全的相似数据拥有证明方法,其特征在于,概率性相似数据拥有证明方法中|cw'|=|cw|=N,判断在相同位置用户C和云服务器S的比特值是否相同;云服务器S不再对所有的密文数据逐比特验证用户的密文数据,需要验证的比特个数的总量为θ,γ←{0,1}λ是云服务器S发送给用户C的随机数,λ为安全参数,h是一个伪随机置换定义如下:
Figure FDA0003005297870000031
协议的输入:用户和云服务器以安全参数λ,比特串的长度N,需要验证用户密文数据的比特数θ,随机数γ作为输入;
协议的输出:随机选择的θ个比特的位置{p1,...,pθ};
协议:对于i从1到θ,计算随机位置pi=hγ(i);
在得到θ个比特位置的汉明距离disHam(cw',cw)之后,云服务器通过计算
Figure FDA0003005297870000032
估算整个密文的汉明距离;如果disHam(cw',cw)≤t,密文数据cw'和密文数据cw是相似的,云服务器S将允许用户C访问存储在云服务器上的密文数据。
6.一种如权利要求1所述云环境中安全的相似数据拥有证明方法的云存储系统,其特征在于,所述云存储系统由一个云存储服务器S和一组用户Cs组成;用户希望在云服务器S上存储敏感数据;S和Cs要实现对上传的密文数据进行相似数据拥有证明。
7.一种应用权利要求1~4任意一项所述云环境中安全的相似数据拥有证明方法的云服务器。
CN201810059859.8A 2018-01-22 2018-01-22 一种云环境中安全的相似数据拥有证明方案 Active CN108416221B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810059859.8A CN108416221B (zh) 2018-01-22 2018-01-22 一种云环境中安全的相似数据拥有证明方案

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810059859.8A CN108416221B (zh) 2018-01-22 2018-01-22 一种云环境中安全的相似数据拥有证明方案

Publications (2)

Publication Number Publication Date
CN108416221A CN108416221A (zh) 2018-08-17
CN108416221B true CN108416221B (zh) 2021-05-14

Family

ID=63126024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810059859.8A Active CN108416221B (zh) 2018-01-22 2018-01-22 一种云环境中安全的相似数据拥有证明方案

Country Status (1)

Country Link
CN (1) CN108416221B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10936605B2 (en) 2019-04-19 2021-03-02 Advanced New Technologies Co., Ltd. Providing oblivious data transfer between computing devices
CN110162551B (zh) * 2019-04-19 2020-08-14 阿里巴巴集团控股有限公司 数据处理方法、装置和电子设备
CN111556027A (zh) * 2020-04-10 2020-08-18 王尧 一种基于电信数据库的访问控制系统
CN114445207B (zh) * 2022-04-11 2022-07-26 广东企数标普科技有限公司 基于数字人民币的税务管理系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887457B (zh) * 2010-07-02 2012-10-03 杭州电子科技大学 基于内容的复制图像检测方法
US9071362B1 (en) * 2012-10-19 2015-06-30 Ciena Corporation Noise-tolerant optical modulation
CN103559259A (zh) * 2013-11-04 2014-02-05 同济大学 基于云平台的消除近似重复网页方法
CN104866478B (zh) * 2014-02-21 2020-06-05 腾讯科技(深圳)有限公司 恶意文本的检测识别方法及装置
CN104200499A (zh) * 2014-09-24 2014-12-10 深圳市英威诺科技有限公司 一种资讯图片智能去重的技术方法
CN106899406B (zh) * 2016-12-15 2019-07-19 中国电子科技集团公司第三十研究所 一种云端数据存储完整性的证明方法

Also Published As

Publication number Publication date
CN108416221A (zh) 2018-08-17

Similar Documents

Publication Publication Date Title
Shen et al. A privacy-preserving and untraceable group data sharing scheme in cloud computing
Wang et al. A blockchain-based framework for data sharing with fine-grained access control in decentralized storage systems
Ren et al. Mutual verifiable provable data auditing in public cloud storage
CN108416221B (zh) 一种云环境中安全的相似数据拥有证明方案
Yang et al. Provable data possession of resource-constrained mobile devices in cloud computing
JP2009515480A (ja) ネットワーク符号化に対するデジタル署名
WO2022183998A1 (zh) 一种数据处理方法、装置、设备及存储介质
He et al. Secure encrypted data deduplication based on data popularity
Chen et al. Task-Attribute-Based Access Control Scheme for IoT via Blockchain.
Tian et al. Public auditing of log integrity for shared cloud storage systems via blockchain
Zhang et al. Security analysis and improvement of a public auditing scheme for secure data storage in fog-to-cloud computing
Kumar et al. Analysis and design of an optimized secure auditing protocol for storing data dynamically in cloud computing
Takeshita et al. TERSE: tiny encryptions and really speedy execution for post-quantum private stream aggregation
CN107360252B (zh) 一种异构云域授权的数据安全访问方法
CN111865948A (zh) 基于匿名身份的对等云认证和密钥协商方法、系统和计算机存储介质
Wang et al. Provable Secure for the Ultra-lightweight RFID Tag Ownership Transfer Protocol in the Context of IoT Commerce.
Álvarez‐Bermejo et al. Distributed key agreement for group communications based on elliptic curves. An application to sensor networks.
CN108600159A (zh) 一种工业控制系统信息安全防护系统
Kumar et al. Hash based approach for providing privacy and integrity in cloud data storage using digital signatures
Song et al. A group key exchange and secure data sharing based on privacy protection for federated learning in edge‐cloud collaborative computing environment
Mao et al. Co-check: collaborative outsourced data auditing in multicloud environment
Suguna et al. Privacy preserving data auditing protocol for secure storage in mobile cloud computing
Mao et al. Collaborative outsourced data integrity checking in multi-cloud environment
Song et al. Enabling Transparent Deduplication and Auditing for Encrypted Data in Cloud
Lu et al. DCR: DataCapsule Replication System

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant