CN110008717B - 支持隐私保护的决策树分类服务系统及方法 - Google Patents

支持隐私保护的决策树分类服务系统及方法 Download PDF

Info

Publication number
CN110008717B
CN110008717B CN201910142676.7A CN201910142676A CN110008717B CN 110008717 B CN110008717 B CN 110008717B CN 201910142676 A CN201910142676 A CN 201910142676A CN 110008717 B CN110008717 B CN 110008717B
Authority
CN
China
Prior art keywords
data
classification
model
encrypted
ciphertext
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910142676.7A
Other languages
English (en)
Other versions
CN110008717A (zh
Inventor
徐剑
王安迪
王琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201910142676.7A priority Critical patent/CN110008717B/zh
Publication of CN110008717A publication Critical patent/CN110008717A/zh
Application granted granted Critical
Publication of CN110008717B publication Critical patent/CN110008717B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于机器学习与隐私保护领域,具体涉及一种支持隐私保护的决策树分类服务系统及方法。所述服务系统包括模型拥有者模块、客户端模块、云服务模块以及密文运算模块;所述方法包括准备阶段及分类阶段。本发明提出了一个面向云端加密数据的支持隐私保护的决策树分类器,设计与实现了支持隐私保护的决策树分类服务系统;利用用户上传的加密数据无法恢复出原始数据,保证外包计算过程的隐私保护,通过将大规模的数据外包到存储、计算资源强大的第三方服务器上,降低用户本地基础设施投资与管理,进而产生更多的经济效益。

Description

支持隐私保护的决策树分类服务系统及方法
技术领域
本发明属于机器学习与隐私保护领域,具体涉及一种支持隐私保护的决策树分类服务系统及方法。
背景技术
目前,针对数据分类过程中的隐私保护研究方法主要有三类:1)数据扰动技术,直接通过添加随机噪声的方式来扰动各个数据记录的值,使得扰动数据的分布看起来与实际数据的分布非常不同。但是扰动数据不具备语义安全性,并且对于分类器而言,无法产生精确的分类结果;2)安全多方计算(Secure Multi-Party Computation,SMC)及其衍生技术,如安全信息检索(PIR)技术、安全数据挖掘(PPDM)技术。这类技术假定数据集是水平或垂直分割并分布存储在各参与方的。各参与方之后可以联合对数据进行挖掘并得出数据挖掘结果,且在处理过程中,各方数据不会泄露给其他方仅被自身获知。然而,这类方法的中间计算任务是基于非加密数据,且数据在传输过程中也是未加密的,容易在数据传输过程泄露隐私信息;3)同态加密技术,相较于传统的只支持密文存储的加密算法,其允许用户直接对密文进行特定的代数运算,得到的数据仍是加密的结果,且与对明文进行同样的操作再将结果加密一样,主要包括全同态加密和部分同态加密技术。全同态加密技术理论上允许第三方在未解密的条件下对密文执行任意运算,但是其在实际应用中仍旧存在一些约束,例如,计算代价昂贵;只支持整数类型的数据;需要固定的乘法深度,不能无限进行加法和乘法运算;以及全同态加密不支持比较和取最值运算等。部分同态加密技术,能够满足乘法或加法同态属性,然而,依然无法支持比较和取最值运算。
综上所述,现有的隐私保护技术无法直接运用于数据分类过程的隐私保护当中,其实际应用存在以下约束:1)当前技术无法保证数据的语义安全,分类结果不精确;2)数据以明文形式传输,无法保证数据在传输过程中不被窃取造成隐私泄露;3)针对加密数据,全同态加密虽然能够满足任意运算但效率低下,部分同态加密仅支持加法或者乘法运算,且两者都不支持比较和求最值运算。
为解决上述问题,大量学者纷纷开展了数据分类过程的隐私保护研究工作,其中将安全多方计算与同态加密算法结合是解决数据分类过程中隐私泄露的主流方法。在该方法中,数据通过同态加密算法进行加密,然后结合安全多方计算的原理,构造面向加密数据的安全协议,如比较协议,求最小值协议等。该安全协议基于交互式环境,参与方A将增加随机噪音的加密数据发送给参与方B,传输过程为密文传输,能够防止中间人攻击,参与方B接收数据后,基于密文进行运算,然后刷新运算结果并返回给参与方A,参与方A去除噪声数据,得到密文结果。安全协议能够面向密文数据进行运算,且保证不泄露各输入值和中间结果给参与计算的其他方获知,很好的保证了密文数据的隐私安全。
虽然,同态加密算法和安全多方计算结合部分解决了密文数据上的比较、求最小值等运算,但是,分类器种类的多样性以及自身结构的复杂性使得通过该方法构造分类器时在安全性、效率以及可用性方面存在一些不足之处,具体如下:
安全性方面:现有的构造分类器的研究中对于数据的隐私安全保护考虑不全面,已有的方案仅能支持训练数据、分类模型、用户输入数据及输出结果中单个或几个的隐私安全,无法同时保证全部数据的隐私安全。同时,对同态加密的私钥缺乏有效的管理,私钥数据容易被不法分子窃取。
效率方面:现有的构造分类器的安全协议基于交互式环境,对设备的网络带宽有一定的依赖,由于安全多方计算,参与方的计算量是相同的,因此对于设备的计算能力也有一定的要求,对于一些资源受限的轻量级设备来说,是难以接受,同时协议的执行需要多次交互和大量数据传输,网络延迟也会对协议的执行产生影响。
可用性方面:现有的构造分类器的研究中分类器的构造过于单一,已有的方案仅设计针对特定分类器的安全协议,缺少普适性,不能适应实际广泛的应用场景。同时,在机器学习分类器分类过程中,要求模型提供者与用户全程在线,且用户仍要参与大量的密文运算,这与用户交付服务方进行数据分类预测的初衷相悖,缺乏实用性。
随着云计算的快速发展以及隐私意识的提高,数据拥有者倾向于将数据加密之后外包给外包服务提供商,同时希望外包服务提供商能够具有加密数据的分析计算能力,以便减轻自身的存储和计算负担,因此,外包环境下的加密数据的机器学习分类器随之诞生。外包环境下的加密数据的机器学习分类器是面向加密数据的机器学习分类器与外包计算相结合发展起来的产物,该分类器包含三方参与实体,即模型拥有者模块、分类服务提供者以及查询用户。模型拥有者模块负责上传加密的训练模型以及同态加密密钥管理,分类服务提供者负责存储加密的分类模型以及提供加密数据的分类服务,查询用户则是加密查询数据的提交者,即分类服务提供者的服务对象,其上传加密查询数据后,等待然后得到最终的分类结果。本发明以决策树分类器为研究对象,提出了一个面向云端加密数据的支持隐私保护的决策树分类器,实现了加密模型上传与存储、加密数据分类以及分类结果可视化等功能。
发明内容
针对上述存在的技术问题,本发明提供一种支持隐私保护的决策树分类服务系统,所述服务系统包括:模型拥有者模块、客户端模块、云服务模块以及密文运算模块;
所述模型拥有者模块是原始训练数据拥有者,主要负责通过学习算法对训练数据进行训练得到分类模型,同态加密算法的密钥生成及分发到云服务器和客户端,模型进行加密,模型上传及定期更新到云服务器中;
所述云服务器是分类服务提供者,负责存储模型和提供分类服务、模型及处理的数据皆为密文;
所述客户端只需发送加密的查询数据,等待后可获知加密的分类结果,解密后得到结果;
所述密文运算模块包含三部分:1)密文比较协议:实现ElGamal加密数据的比较,用于决策树模型中阈值的比较;2)密文转换协议:实现密文数据从一种同态加密到另一种同态加密的数据转换,用于GM同态加密算法到ElGamal同态加密算法的转换;3)密文决策树分类器:调用密文比较协议以模块线性组合方式构造半诚实模型下安全的决策树分类器。
一种支持隐私保护的决策树分类服务系统的控制方法,采用所述的支持隐私保护的决策树分类服务系统,分为准备阶段及分类阶段:
一、所述准备阶段包括以下步骤:
步骤1,密钥生成:
首先由模型拥有者模块进行密钥生成;
所述模型拥有者模块生成用于加解密的ElGamal同态加密算法的公私钥对<pke,ske>及GM同态加密算法的公私钥对<pkgm,skgm>,其中公钥为pke,pkgm,私钥为ske,skgm;pke,pkgm公开,用于数据的加密;
步骤2,秘钥分发:
当客户端发送分类请求时,所述模型拥有者模块将用于解密的私钥ske,skgm通过可信通道发送给客户端;
步骤3,获取训练数据,选择决策树分类算法作为机器学习算法,对训练数据进行训练得到分类模型W;
步骤4,模型转换:
对分类模型W进行模型转换,将该模型树结构中从根结点到每一叶子结点的路转换为线性函数;
所述模型拥有者模块使用同态加密算法对分类模型W进行加密;通过决策树算法得到的模型为二叉决策树,其包括阈值和树结构两部分,对树结构进行模型转换,将其转换为线性函数;
步骤5,模型加密:
使用公钥对该模型进行加密;
步骤6,发送模型:
将加密后的模型发送给CS;
步骤7,模型拥有者模块下线,不再参与后面的分类工作;
二、所述分类阶段包括以下步骤:
步骤1,云服务器启动服务,等待客户端发送分类请求;
步骤2,客户端选择查询数据x,其次使用公钥对查询数据x进行加密,然后将加密后的查询数据E(x)发送到云服务器;
步骤3,当云服务器得到加密查询数据E(x)后,根据数据类型选择加密模型E(W);
步骤4,云服务器在客户端的辅助分类处理的配合下执行分类处理,得到加密的分类结果E(R),将其发送给客户端;
步骤5,客户端得到加密的分类结果E(R)后,使用私钥对E(R)解密,得到最终的分类结果R,R表示分类标签vj
所述准备阶段的步骤1中具体包括以下步骤:
步骤1.1,ElGamal同态加密
ElGamal同态加密算法满足单一的乘法同态,为满足系统的需要,对该算法进行改进,使其满足加法同态和数乘同态,改进后的ElGamal加密算法描述如下:
步骤1.1.1,生成公私钥;
输入安全参数λ,利用群系统生成算法生成(G,p,g)←Gen(1λ),其中p是长度为λ的奇素数,g是循环群
Figure BDA0001979034670000041
的生成元,均匀随机选取
Figure BDA0001979034670000042
gcd(α,p)=1,计算y=gxmodp;输出公钥(y,g,p,α),私钥为x;
步骤,1.1.2,加密;
被加密的信息为M,选择一个随机数k,k与p-1互质,计算a=gkmodp,b=yk·αMmodp,(a,b)为密文,是明文的两倍长;
步骤1.1.3,解密;
根据αM=b/ax(modp),进而求对数得到:M=logααM;只需部分解密到αM即可,无需完全解密;
步骤1.2,GM同态加密;
GM同态加密算法,即Goldwasser-Micali同态加密算法是第一个在标准模型下被证明是语义安全的加密算法,其安全性是基于判定二次剩余假设,具体密钥生成算法描述如下:
假设GenMod是一个模数生成算法,安全参数为λ;GM算法GM=(Gen,Enc,Dec)包括以下步骤:
步骤1.2.1,Gen输入安全参数λ,调用GenMod(1λ),生成(N,p,q);其中p,q是两个长度为λ的互异奇素数,并且y←QNR+;公钥为(N,y),私钥为(p,q);
步骤1.2.2,Enc输入公钥N,被加密信息为
Figure BDA0001979034670000051
是m的二进制表示,mi∈{0,1};对于每个i∈[l],随机选择
Figure BDA0001979034670000052
Figure BDA0001979034670000053
输出c:=c1…cl为密文;
步骤1.2.3,Dec输入密文c:=c1…cl,对于每个i∈[l],如果ci∈QRN,则mi:=0;如果ci∈QNR+则mi:=1;其他则mi=⊥;输出m:=m1…ml
其中QNR+表示
Figure BDA0001979034670000054
中关于乘法的非二次平方剩余类的集合,QRN表示
Figure BDA0001979034670000055
中关于乘法的平方剩余类的集合,⊥表示计算错误,或者无效的结果,甚至是不允许的行为。
所述准备阶段的步骤4中具体包括以下步骤:
步骤4.1,将阈值转换为布尔型数值;
比较属性值xi和判定结点阈值ni大小,属性值xi即所述查询数据x的第i个属性值,比较结果表示为:
Figure BDA0001979034670000056
其中树结构的判定结点阈值为bi,其中b1为根结点阈值;叶子结点取值为vj,即分类标签;
若bi=1,则走左子树,若bi=0,则走右子树;记结点到左子树的路径花销为ei,l=1-bi,到右子树的路径花销为ei,r=bi,l表示左子树,r表示右子树;
步骤4.2,计算从根结点到每个叶子结点的路径花销;若有6个叶子结点,则从根结点b1到叶子结点的路共有6条,其总路径花销为
Figure BDA0001979034670000057
b表示判定结点阈值的集合,如下式所示,6条路分别为:
Figure BDA0001979034670000061
Figure BDA0001979034670000062
Figure BDA0001979034670000063
Figure BDA0001979034670000064
Figure BDA0001979034670000065
Figure BDA0001979034670000066
步骤4.3,将二叉决策树模型转换为线性函数;从根结点到每个叶子结点的路径对应于一个线性函数,表示为
Figure BDA0001979034670000067
若有6个叶子结点,则可转换为6个线性函数,前3个线性函数为:
Figure BDA0001979034670000068
根据上述过程,模型W可以表示为多个线性函数及判定结点{h(b)vj,ni},i表示第i个判定结点,j表示第j个叶子结点;
经过上述转换只需通过计算线性函数便可获知最终的预测结果。
所述分类阶段步骤4中所述的分类过程具体为:
通过密文决策树分类器,调用密文比较协议以模块线性组合方式构造半诚实模型下安全的决策树分类器;
所述密文决策树分类器中,U和CS均是半诚实的,且在分类开始之前,除公开发表的公钥外,客户端U和云服务器CS分别拥有一些隐私信息,其中U拥有查询数据x=(x1,..,xm)及私钥ske,skgm,CS拥有加密的分类模型
Figure BDA0001979034670000069
Figure BDA00019790346700000610
的参数b是未知的,需要U和CS通过执行协议1获取得到每个bi的值,然后执行协议3计算各路径花销
Figure BDA00019790346700000611
和线性函数
Figure BDA00019790346700000612
的值,获取最终的分类结果;设判定结点个数为m,即i∈{1,...,m};叶子结点个数为k,即j∈{1,...,k};线性函数个数为n;
所述分类过程包括以下步骤:
步骤4.1,在DTreeClassifer分类协议中,U分别使用GM和ElGamal同态加密算法的公钥对输入数据xi按位进行加密,得到加密数据[xi]e,[xi]gm后再发送给CS,CS没有对应的私钥ske,skgm无法对U加密数据[xi]e,[xi]gm进行解密,保证了U输入数据xi的安全;
步骤4.2,CS和U联合执行PvtCmp密文比较协议,CS获取ElGamal加密的加密数据[bi]e,在该协议执行过程中,U无法获知CS的输入数据和输出结果,保证了CS的输入和输出结果的隐私安全,CS仅得到加密的输出结果保证了DTreeClassifer协议运算过程中中间数据的隐私安全;
步骤4.3,CS将加密的加密数据[bi]e带入到路径花销
Figure BDA0001979034670000071
和线性函数
Figure BDA0001979034670000072
中进行计算,由于ElGamal加密算法的加法同态性质,CS可以得到与明文相同的执行结果,且能够保证数据的安全性;为
Figure BDA0001979034670000073
Figure BDA0001979034670000074
增加干扰ri,保证路径花销和线性函数的数据安全,将增加干扰后的
Figure BDA0001979034670000075
Figure BDA0001979034670000076
发送到U,U解密
Figure BDA0001979034670000077
Figure BDA0001979034670000078
得到
Figure BDA0001979034670000079
Figure BDA00019790346700000710
若解密后的路径花销
Figure BDA00019790346700000711
为0,则对应的
Figure BDA00019790346700000712
为最终的分类标签;在此执行过程中,U解密后得到的是增加干扰后的值,其中
Figure BDA00019790346700000713
因此解密后也不能获取原有数据,保证了分类模型仅能被数据拥有者获知;当且仅当
Figure BDA00019790346700000714
为0时,U得到的
Figure BDA00019790346700000715
才是分类标签,因此保证了U仅能获知查询数据所属的分类,而不能获知除此之外的其他分类标签信息;综上所述,DTreeClassifer分类协议既保证了客户端输入数据及输出结果的安全性也保证了分类模型的安全性,实现了决策树分类器的分类过程的隐私保护。
所述分类阶段步骤4中,所述密文比较协议用于实现ElGamal加密数据的比较,用于分类模型中判定结点阈值ni和属性值xi的比较;比较操作是决策树分类器执行分类处理的核心操作,为满足决策树分类服务系统的需要,基于PvtCmp(Private comparisonprotocol)比较协议,具体为:
计算
Figure BDA00019790346700000716
其中i∈{1,..,t},若存在i∈{1,..,t}使得ci=0成立,则
Figure BDA00019790346700000717
其中x=(x1,...,xt),y=(y1,...,yt)均为二进制形式,t表示x和y的二进制位数,客户端U和云服务器CS输入数据的二进制位数相等;
PvtCmp比较协议由两方参与,U和CS,设U的输入数据为[x]e,[x]gm,CS的输入数据为[y]e,[y]gm,以二进制加密形式表示,二进制位数相等,长度为t,具体包括以下步骤:
步骤4.1,U将加密的输入数据[x]e,[x]gm发送给CS;
步骤4.2,CS接收U的加密的输入数据[x]e,[x]gm,然后从{0,1}中随机选择一个数,记为b1,计算s←1-2b1,然后执行两层循环,外循环次数为t,内循环次数为j<i,i=1,...,t,内循环中先计算xj,yj的异或结果
Figure BDA00019790346700000718
再使用密文转换协议将异或结果
Figure BDA00019790346700000719
转换为
Figure BDA0001979034670000081
接着对异或结果
Figure BDA0001979034670000082
进行求和得到
Figure BDA0001979034670000083
内循环结束后,计算
Figure BDA0001979034670000084
并选择随机值ri将其添加到
Figure BDA0001979034670000085
中得到
Figure BDA0001979034670000086
一次外循环结束得到[ci]e,则t次外循环结束后可得[c]e=([c1],....[ct])e;CS将结果[c]e=([c1],....[ct])e发送给U;
步骤4.3,U接收并解密[c]e,判断是否存在i∈{1,..,t}使得ci=0成立,若存在,则b2=1,否则b2=0;将b2进行加密得到[b2]e并将其发送给CS;
步骤4.4,CS接收[b2]e,计算
Figure BDA0001979034670000087
其中[b]e≡[x<y]e,即若b=1,则x<y,否,则x≥y;
所述步骤4.1-4.4中,U接收[c]e并解密,由于ri的存在,U不能获知其真实值,保证了CS输入数据y的安全性;CS接收U的x和b2,两者皆为密文表示,CS没有私钥无法解密,保证了U中输入数据x和中间数据b2的安全性;运算过程均基于密文操作,因此,该PvtCmp比较协议同时保证了客户端与云服务器相关数据的安全性。
所述分类阶段步骤4中所述的密文转换协议用于实现加密数据从一种同态加密到另一种同态加密的数据转换,用于GM同态加密的加密数据到ElGamal同态加密的加密数据的转换,同时保证加密数据的隐私安全;其应用场景为参与方A拥有两个同态加密算法的公钥pk1,pk2以及pk1加密的加密数据[c]1,参与方B拥有相应同态加密算法的私钥sk1,sk2,通过执行密文转换协议,A最终得到pk2加密的加密数据[c]2;在上述过程中,B不会获知任何与A输入数据[c]1其明文数据c相关的信息;
所述密文转换协议在密文比较协议中使用用于实现GM同态加密算法加密的加密数据到ElGamal同态加密算法加密的加密数据的转换,pk1表示GM的公钥pkgm,pk2表示ElGamal的公钥pke,[c]1表示GM加密的加密数据,其中c表示
Figure BDA0001979034670000088
本发明的有益效果:
本发明以决策树分类器为研究对象,在此基础上,提出了一个面向云端加密数据的支持隐私保护的决策树分类器,设计与实现了支持隐私保护的决策树分类服务系统。
本发明利用用户上传的加密数据无法恢复出原始数据,保证外包计算过程的隐私保护,通过将大规模的数据外包到存储、计算资源强大的第三方服务器上,降低用户本地基础设施投资与管理,进而产生更多的经济效益;
本发明提出了一个面向云端加密数据的支持隐私保护的决策树分类器。给出了分类器的整体框架,描述了分类器的基本组成与实体构成,对决策树训练及分类过程进行了详细研究,设计了对应于明文操作的安全密文协议,使得密文的操作结果解密后与执行相同明文操作一致,并对决策树模型进行了转换使其适应于密文数据操作。
本发明设计合理,易于实现,具有很好的实用价值。
附图说明
图1为本发明具体实施方式中所述系统准备阶段流程图;
图2为本发明具体实施方式中所述系统准备阶段的模型转换流程图;
图3为本发明具体实施方式中所述变换二叉树决策树生成图;
图4为本发明具体实施方式中所述系统分类阶段流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施实例,对本发明做出进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明基于机器学习,提出了一种支持隐私保护的决策树分类服务系统及控制方法,所述服务系统包括:模型拥有者模块、客户端模块、云服务模块以及密文运算模块;
所述服务系统的控制方法分为准备阶段及分类阶段:
一、所述准备阶段如图1所示,包括以下步骤:
步骤1,密钥生成:
所述服务系统的数据安全是基于同态加密算法的安全的,因此在准备阶段首先由模型拥有者模块进行密钥生成;
所述同态加密算法描述了一类加密算法,其拥有的同态属性为:能够在密文上直接执行操作,且密文操作的结果解密后获得的结果与明文上执行相同操作的结果一致;其定义的数学表示为:对于一个加密算法,其在明文空间上执行的操作为
Figure BDA0001979034670000091
例如加法;如果存在相应的可在密文空间上执行的操作
Figure BDA0001979034670000092
称满足下式的加密算法为同态加密算法;
Figure BDA0001979034670000093
其中,m1,m2为明文数据,pk表示公钥用于加密,sk表示私钥用于加密,Enc(.)表示加密函数,其输入为明文数据,输出为加密数据,Dec(.)表示解密函数,其输入为加密数据输出为明文数据;
所述模型拥有者模块生成用于加解密的ElGamal同态加密算法的公私钥对<pke,ske>及GM同态加密算法的公私钥对<pkgm,skgm>,其中公钥为pke,pkgm,私钥为ske,skgm;pke,pkgm公开,用于数据的加密,具体包括以下步骤:
步骤1.1,ElGamal同态加密
ElGamal同态加密算法满足单一的乘法同态,为满足系统的需要,对该算法进行改进,使其满足加法同态和数乘同态,改进后的ElGamal加密算法描述如下:
步骤1.1.1,生成公私钥;
输入安全参数λ,利用群系统生成算法生成(G,p,g)←Gen(1λ),其中p是长度为λ的奇素数,g是循环群
Figure BDA0001979034670000101
的生成元,均匀随机选取
Figure BDA0001979034670000102
gcd(α,p)=1,计算y=gxmodp;输出公钥(y,g,p,α),私钥为x;
步骤,1.1.2,加密;
被加密的信息为M,选择一个随机数k,k与p-1互质,计算a=gkmodp,b=yk·αMmodp,(a,b)为密文,是明文的两倍长;
步骤1.1.3,解密;
根据αM=b/ax(modp),进而求对数得到:M=logααM;虽然求对数要付出很大的代价,需要在αM的空间里搜索结果,但是本发明中有的只需部分解密到αM即可,无需完全解密,减少了计算耗时;
步骤1.2,GM同态加密;
GM同态加密算法,即Goldwasser-Micali同态加密算法是第一个在标准模型下被证明是语义安全的加密算法,其安全性是基于判定二次剩余假设,具体密钥生成算法描述如下:
假设GenMod是一个模数生成算法,安全参数为λ;GM算法GM=(Gen,Enc,Dec)包括以下步骤:
步骤1.2.1,Gen输入安全参数λ,调用GenMod(1λ),生成(N,p,q);其中p,q是两个长度为λ的互异奇素数,并且y←QNR+;公钥为(N,y),私钥为(p,q);
步骤1.2.2,Enc输入公钥N,被加密信息为
Figure BDA0001979034670000103
是m的二进制表示,mi∈{0,1};对于每个i∈[l],随机选择
Figure BDA0001979034670000111
Figure BDA0001979034670000112
输出c:=c1…cl为密文;
步骤1.2.3,Dec输入密文c:=c1…cl,对于每个i∈[l],如果ci∈QRN,则mi:=0;如果ci∈QNR+则mi:=1;其他则mi=⊥;输出m:=m1…ml
其中QNR+表示
Figure BDA0001979034670000113
中关于乘法的非二次平方剩余类的集合,QRN表示
Figure BDA0001979034670000114
中关于乘法的平方剩余类的集合,⊥表示计算错误,或者无效的结果,甚至是不允许的行为;
步骤2,秘钥分发:
当客户端发送分类请求时,所述模型拥有者模块将用于解密的私钥ske,skgm通过可信通道发送给客户端,由于模型和私钥不归同一参与方所有,因此能够保证模型的隐私安全;
步骤3,获取训练数据,选择决策树分类算法作为机器学习算法,对训练数据进行训练得到分类模型W;
步骤4,模型转换:
为保证分类模型W的结构不被第三方获知,对其进行模型转换,将该模型树结构中从根结点到每一叶子结点的路转换为线性函数;
所述模型拥有者模块使用同态加密算法对分类模型W进行加密,以此保证模型的隐私安全;然而通过决策树算法得到的模型为二叉决策树,其包括阈值和树结构两部分,因此对树结构进行模型转换,将其转换为线性函数,从而保证了阈值及树结构两者的隐私安全,其转换流程如图2所示,具体为:
步骤4.1,将阈值转换为布尔型数值;
比较属性值xi和判定结点阈值ni大小,属性值xi即所述查询数据x的第i个属性值,比较结果表示为:
Figure BDA0001979034670000115
其中树结构的判定结点阈值为bi,本实施例中,i∈{1,..,6},其中b1为根结点;叶子结点取值为vj,即分类标签,本实施例中,j∈{1,..,6};
本实施例如图3所示,若bi=1,则走左子树,若bi=0,则走右子树;记结点到左子树的路径花销为ei,l=1-bi,到右子树的路径花销为ei,r=bi,l表示左子树,r表示右子树;
步骤4.2,计算从根结点到每个叶子结点的路径花销;本实施例中,其有6个叶子结点,所以从根结点b1到叶子结点的路共有6条,其总路径花销为
Figure BDA0001979034670000116
b表示判定结点阈值的集合,如下式所示,6条路分别为:
Figure BDA0001979034670000121
Figure BDA0001979034670000122
Figure BDA0001979034670000123
Figure BDA0001979034670000124
Figure BDA0001979034670000125
Figure BDA0001979034670000126
步骤4.3,将二叉决策树模型转换为线性函数;从根结点到每个叶子结点的路径对应于一个线性函数,表示为
Figure BDA0001979034670000127
本实施例中,可转换为6个线性函数,前3个线性函数为:
Figure BDA0001979034670000128
根据上述过程,模型W可以表示为多个线性函数及判定结点{h(b)vj,ni},i表示第i个判定结点,j表示第j个叶子结点;
经过上述转换只需通过计算线性函数便可获知最终的预测结果;
步骤5,模型加密:
由于要将该模型发送给非可信的第三方CS,因此在发送前使用公钥对该模型进行加密;
步骤6,发送模型:
将加密后的模型发送给CS;
步骤7,模型拥有者模块下线,不再参与后面的分类工作;
二、所述分类阶段如图4所示,包括以下步骤:
步骤1,云服务器启动服务,等待客户端发送分类请求;
步骤2,客户端选择查询数据x,其次使用公钥对查询数据x进行加密,然后将加密后的查询数据E(x)发送到云服务器;
步骤3,当云服务器得到加密查询数据E(x)后,根据数据类型选择加密模型E(W);
步骤4,云服务器在客户端的辅助分类处理的配合下执行分类处理,得到加密的分类结果E(R),将其发送给客户端,分类过程具体为:
通过密文决策树分类器,调用密文比较协议以模块线性组合方式构造半诚实模型下安全的决策树分类器;
所述密文决策树分类器中,U和CS均是半诚实的,且在分类开始之前,除公开发表的公钥外,客户端U和云服务器CS分别拥有一些隐私信息,其中U拥有查询数据x=(x1,..,xm)及私钥ske,skgm,CS拥有加密的分类模型
Figure BDA0001979034670000131
Figure BDA0001979034670000132
的参数b是未知的,需要U和CS通过执行协议1获取得到每个bi的值,然后执行协议3计算各路径花销
Figure BDA0001979034670000133
和线性函数
Figure BDA0001979034670000134
的值,获取最终的分类结果;设判定结点个数为m,即i∈{1,...,m};叶子结点个数为k,即j∈{1,...,k};线性函数个数为n;
步骤4.1,在DTreeClassifer分类协议中,U分别使用GM和ElGamal同态加密算法的公钥对输入数据xi按位进行加密,得到加密数据[xi]e,[xi]gm后再发送给CS,CS没有对应的私钥ske,skgm无法对U加密数据[xi]e,[xi]gm进行解密,保证了U输入数据xi的安全;
步骤4.2,CS和U联合执行PvtCmp密文比较协议,CS获取ElGamal加密的加密数据[bi]e,在该协议执行过程中,U无法获知CS的输入数据和输出结果,保证了CS的输入和输出结果的隐私安全,CS仅得到加密的输出结果保证了DTreeClassifer协议运算过程中中间数据的隐私安全;
步骤4.3,CS将加密的加密数据[bi]e带入到路径花销
Figure BDA0001979034670000135
和线性函数
Figure BDA0001979034670000136
中进行计算,由于ElGamal加密算法的加法同态性质,CS可以得到与明文相同的执行结果,且能够保证数据的安全性;为
Figure BDA0001979034670000137
Figure BDA0001979034670000138
增加干扰ri,保证路径花销和线性函数的数据安全,将增加干扰后的
Figure BDA0001979034670000139
Figure BDA00019790346700001310
发送到U,U解密
Figure BDA00019790346700001311
Figure BDA00019790346700001312
得到
Figure BDA00019790346700001313
Figure BDA00019790346700001314
若解密后的路径花销
Figure BDA00019790346700001315
为0,则对应的
Figure BDA00019790346700001316
为最终的分类标签;在此执行过程中,U解密后得到的是增加干扰后的值,其中
Figure BDA00019790346700001317
因此解密后也不能获取原有数据,保证了分类模型仅能被数据拥有者获知;当且仅当
Figure BDA00019790346700001318
为0时,U得到的
Figure BDA00019790346700001319
才是分类标签,因此保证了U仅能获知查询数据所属的分类,而不能获知除此之外的其他分类标签信息;综上所述,DTreeClassifer分类协议既保证了客户端输入数据及输出结果的安全性也保证了分类模型的安全性,实现了决策树分类器的分类过程的隐私保护;
步骤5,客户端得到加密的分类结果E(R)后,使用私钥对E(R)解密,得到最终的分类结果R,R表示分类标签vj
在上述的分类阶段,客户端仅能获知查询数据x及其分类结果R,无法获知真实的模型W,保证了模型W对于客户端的隐私保护,而云服务器既不能获知模型W的真实值也不能获知查询数据x及其分类结果R,保证了模型W、查询数据x及其分类结果R对于云服务器的隐私安全;
在步骤4中,所述密文比较协议用于实现ElGamal加密数据的比较,用于分类模型中判定结点阈值ni和属性值xi的比较;比较操作是决策树分类器执行分类处理的核心操作,为满足决策树分类服务系统的需要,基于PvtCmp(Private comparison protocol)比较协议,设计了本发明使用的PvtCmp比较协议,其核心思想为:计算
Figure BDA0001979034670000141
其中i∈{1,..,t},若存在i∈{1,..,t}使得ci=0成立,则
Figure BDA0001979034670000142
其中x=(x1,...,xt),y=(y1,...,yt)均为二进制形式,t表示x和y的二进制位数,客户端U和云服务器CS输入数据的二进制位数相等;
PvtCmp比较协议由两方参与,U和CS,设U的输入数据为[x]e,[x]gm,CS的输入数据为[y]e,[y]gm,以二进制加密形式表示,二进制位数相等,长度为t,具体包括以下步骤:
步骤4.1,U将加密的输入数据[x]e,[x]gm发送给CS;
步骤4.2,CS接收U的加密的输入数据[x]e,[x]gm,然后从{0,1}中随机选择一个数,记为b1,计算s←1-2b1,然后执行两层循环,外循环次数为t,内循环次数为j<i,i=1,...,t,内循环中先计算xj,yj的异或结果
Figure BDA0001979034670000143
再使用密文转换协议将异或结果
Figure BDA0001979034670000144
转换为
Figure BDA0001979034670000145
接着对异或结果
Figure BDA0001979034670000146
进行求和得到
Figure BDA0001979034670000147
内循环结束后,计算
Figure BDA0001979034670000148
并选择随机值ri将其添加到
Figure BDA0001979034670000149
中得到
Figure BDA00019790346700001410
一次外循环结束得到[ci]e,则t次外循环结束后可得[c]e=([c1],....[ct])e;CS将结果[c]e=([c1],....[ct])e发送给U;
步骤4.3,U接收并解密[c]e,判断是否存在i∈{1,..,t}使得ci=0成立,若存在,则b2=1,否则b2=0;将b2进行加密得到[b2]e并将其发送给CS;
步骤4.4,CS接收[b2]e,计算
Figure BDA00019790346700001411
其中[b]e≡[x<y]e,即若b=1,则x<y,否,则x≥y;
步骤4.1-4.4中,U接收[c]e并解密,由于ri的存在,U不能获知其真实值,保证了CS输入数据y的安全性;CS接收U的x和b2,两者皆为密文表示,CS没有私钥无法解密,保证了U中输入数据x和中间数据b2的安全性;运算过程均基于密文操作,因此,该PvtCmp比较协议同时保证了客户端与云服务器相关数据的安全性;
所述密文转换协议用于实现加密数据从一种同态加密到另一种同态加密的数据转换,用于GM同态加密的加密数据到ElGamal同态加密的加密数据的转换,同时保证加密数据的隐私安全;其应用场景为参与方A拥有两个同态加密算法的公钥pk1,pk2以及pk1加密的加密数据[c]1,参与方B拥有相应同态加密算法的私钥sk1,sk2,通过执行密文转换协议,A最终得到pk2加密的加密数据[c]2;在上述过程中,B不会获知任何与A输入数据[c]1其明文数据c相关的信息;
所述密文转换协议在密文比较协议中使用用于实现GM同态加密算法加密的加密数据到ElGamal同态加密算法加密的加密数据的转换,pk1表示GM的公钥pkgm,pk2表示ElGamal的公钥pke,[c]1表示GM加密的加密数据,其中c表示
Figure BDA0001979034670000151

Claims (7)

1.一种支持隐私保护的决策树分类服务系统,其特征在于,所述服务系统包括:模型拥有者模块、客户端模块、云服务模块以及密文运算模块;
所述模型拥有者模块是原始训练数据拥有者,主要负责通过学习算法对训练数据进行训练得到分类模型,同态加密算法的密钥生成及分发到云服务器和客户端,模型进行加密,模型上传及定期更新到云服务器中;
所述云服务器是分类服务提供者,负责存储模型和提供分类服务、模型及处理的数据皆为密文;
所述客户端只需发送加密的查询数据,等待后可获知加密的分类结果,解密后得到结果;
所述密文运算模块包含三部分:1)密文比较协议:实现ElGamal加密数据的比较,用于决策树模型中阈值的比较;2)密文转换协议:实现密文数据从一种同态加密到另一种同态加密的数据转换,用于GM同态加密算法到ElGamal同态加密算法加密的加密数据转换;3)密文决策树分类器:调用密文比较协议以模块线性组合方式构造半诚实模型下安全的决策树分类器。
2.一种支持隐私保护的决策树分类服务系统的控制方法,其特征在于,采用权利要求1所述的支持隐私保护的决策树分类服务系统,分为准备阶段及分类阶段:
一、所述准备阶段包括以下步骤:
步骤1,密钥生成:
首先由模型拥有者模块进行密钥生成;
所述模型拥有者模块生成用于加解密的ElGamal同态加密算法的公私钥对<pke,ske>及GM同态加密算法的公私钥对<pkgm,skgm>,其中公钥为pke,pkgm,私钥为ske,skgm;pke,pkgm公开,用于数据的加密;
步骤2,秘钥分发:
当客户端发送分类请求时,所述模型拥有者模块将用于解密的私钥ske,skgm通过可信通道发送给客户端;
步骤3,获取训练数据,选择决策树分类算法作为机器学习算法,对训练数据进行训练得到分类模型W;
步骤4,模型转换:
对分类模型W进行模型转换,将该模型树结构中从根结点到每一叶子结点的路转换为线性函数;
所述模型拥有者模块使用同态加密算法对分类模型W进行加密;通过决策树算法得到的模型为二叉决策树,其包括阈值和树结构两部分,对树结构进行模型转换,将其转换为线性函数;
步骤5,模型加密:
使用公钥对该模型进行加密;
步骤6,发送模型:
将加密后的模型发送给CS;
步骤7,模型拥有者模块下线,不再参与后面的分类工作;
二、所述分类阶段包括以下步骤:
步骤1,云服务器启动服务,等待客户端发送分类请求;
步骤2,客户端选择查询数据x,其次使用公钥对查询数据x进行加密,然后将加密后的查询数据E(x)发送到云服务器;
步骤3,当云服务器得到加密查询数据E(x)后,根据数据类型选择加密模型E(W);
步骤4,云服务器在客户端的辅助分类处理的配合下执行分类处理,得到加密的分类结果E(R),将其发送给客户端;
步骤5,客户端得到加密的分类结果E(R)后,使用私钥对E(R)解密,得到最终的分类结果R,R表示分类标签vj
3.根据权利要求2所述的支持隐私保护的决策树分类服务系统的控制方法,其特征在于,所述准备阶段的步骤1中具体包括以下步骤:
步骤1.1,ElGamal同态加密
ElGamal同态加密算法满足单一的乘法同态,为满足系统的需要,对该算法进行改进,使其满足加法同态和数乘同态,改进后的ElGamal加密算法描述如下:
步骤1.1.1,生成公私钥;
输入安全参数λ,利用群系统生成算法生成(G,p,g)←Gen(1λ),其中p是长度为λ的奇素数,g是循环群
Figure FDA0003931940610000021
的生成元,均匀随机选取
Figure FDA0003931940610000022
gcd(α,p)=1,计算y=gxmodp;输出公钥(y,g,p,α),私钥为x;
步骤,1.1.2,加密;
被加密的信息为M,选择一个随机数k,k与p-1互质,计算a=gkmod p,b=yk·αMmod p,(a,b)为密文,是明文的两倍长;
步骤1.1.3,解密;
根据αM=b/ax(mod p),进而求对数得到:M=logααM;只需部分解密到αM即可,无需完全解密;
步骤1.2,GM同态加密;
GM同态加密算法,即Goldwasser-Micali同态加密算法是第一个在标准模型下被证明是语义安全的加密算法,其安全性是基于判定二次剩余假设,具体密钥生成算法描述如下:
假设GenMod是一个模数生成算法,安全参数为λ;GM算法GM=(Gen,Enc,Dec)包括以下步骤:
步骤1.2.1,Gen输入安全参数λ,调用GenMod(1λ),生成(N,p,q);其中p,q是两个长度为λ的互异奇素数,并且y←QNR+;公钥为(N,y),私钥为(p,q);
步骤1.2.2,Enc输入公钥N,被加密信息为
Figure FDA0003931940610000034
m=m1…ml∈{0,1}l是m的二进制表示,mi∈{0,1};对于每个i∈[l],随机选择
Figure FDA0003931940610000031
输出c:=c1…cl为密文;
步骤1.2.3,Dec输入密文c:=c1…cl,对于每个i∈[l],如果ci∈QRN,则mi:=0;如果ci∈QNR+则mi:=1;其他则mi=⊥;输出m:=m1…ml
其中QNR+表示
Figure FDA0003931940610000035
中关于乘法的非二次平方剩余类的集合,QRN表示
Figure FDA0003931940610000032
中关于乘法的平方剩余类的集合,⊥表示计算错误,或者无效的结果,甚至是不允许的行为。
4.根据权利要求2所述的支持隐私保护的决策树分类服务系统的控制方法,其特征在于,所述准备阶段的步骤4中具体包括以下步骤:
步骤4.1,将阈值转换为布尔型数值;
比较属性值xi和判定结点阈值ni大小,属性值xi即所述查询数据x的第i个属性值,比较结果表示为:
Figure FDA0003931940610000033
其中树结构的判定结点阈值为bi,其中b1为根结点阈值;叶子结点取值为vj,即分类标签;
若bi=1,则走左子树,若bi=0,则走右子树;记结点到左子树的路径花销为ei,l=1-bi,到右子树的路径花销为ei,r=bi,l表示左子树,r表示右子树;
步骤4.2,计算从根结点到每个叶子结点的路径花销;若有6个叶子结点,则从根结点b1到叶子结点的路共有6条,其总路径花销为
Figure FDA00039319406100000414
b表示判定结点阈值的集合,如下式所示,6条路分别为:
Figure FDA0003931940610000041
Figure FDA0003931940610000042
Figure FDA0003931940610000043
Figure FDA0003931940610000044
Figure FDA0003931940610000045
Figure FDA0003931940610000046
步骤4.3,将二叉决策树模型转换为线性函数;从根结点到每个叶子结点的路径对应于一个线性函数,表示为
Figure FDA0003931940610000047
若有6个叶子结点,则可转换为6个线性函数,前3个线性函数为:
Figure FDA0003931940610000048
根据上述过程,模型W可以表示为多个线性函数及判定结点{h(b)vj,ni},i表示第i个判定结点,j表示第j个叶子结点;
经过上述转换只需通过计算线性函数便可获知最终的预测结果。
5.根据权利要求2所述的支持隐私保护的决策树分类服务系统的控制方法,其特征在于,所述分类阶段步骤4中所述的分类过程具体为:
通过密文决策树分类器,调用密文比较协议以模块线性组合方式构造半诚实模型下安全的决策树分类器;
所述密文决策树分类器中,U和CS均是半诚实的,且在分类开始之前,除公开发表的公钥外,客户端U和云服务器CS分别拥有一些隐私信息,其中U拥有查询数据x=(x1,..,xm)及私钥ske,skgm,CS拥有加密的分类模型
Figure FDA0003931940610000049
Figure FDA00039319406100000410
Figure FDA00039319406100000411
的参数b是未知的,需要U和CS通过执行协议1获取得到每个bi的值,然后执行协议3计算各路径花销
Figure FDA00039319406100000412
和线性函数
Figure FDA00039319406100000413
的值,获取最终的分类结果;设判定结点个数为m,即i∈{1,...,m};叶子结点个数为k,即j∈{1,...,k};线性函数个数为n;
所述分类过程包括以下步骤:
步骤4.1,在DTreeClassifer分类协议中,U分别使用GM和ElGamal同态加密算法的公钥对输入数据xi按位进行加密,得到加密数据[xi]e,[xi]gm后再发送给CS,CS没有对应的私钥ske,skgm无法对U加密数据[xi]e,[xi]gm进行解密,保证了U输入数据xi的安全;
步骤4.2,CS和U联合执行PvtCmp密文比较协议,CS获取ElGamal加密的加密数据[bi]e,在该协议执行过程中,U无法获知CS的输入数据和输出结果,保证了CS的输入和输出结果的隐私安全,CS仅得到加密的输出结果保证了DTreeClassifer协议运算过程中中间数据的隐私安全;
步骤4.3,CS将加密的加密数据[bi]e带入到路径花销
Figure FDA0003931940610000051
和线性函数
Figure FDA0003931940610000052
中进行计算,由于ElGamal加密算法的加法同态性质,CS可以得到与明文相同的执行结果,且能够保证数据的安全性;为
Figure FDA0003931940610000053
Figure FDA0003931940610000054
增加干扰ri,保证路径花销和线性函数的数据安全,将增加干扰后的
Figure FDA0003931940610000055
Figure FDA0003931940610000056
发送到U,U解密
Figure FDA0003931940610000057
Figure FDA0003931940610000058
得到
Figure FDA0003931940610000059
Figure FDA00039319406100000510
若解密后的路径花销
Figure FDA00039319406100000511
为0,则对应的
Figure FDA00039319406100000512
为最终的分类标签;在此执行过程中,U解密后得到的是增加干扰后的值,其中
Figure FDA00039319406100000513
因此解密后也不能获取原有数据,保证了分类模型仅能被数据拥有者获知;当且仅当
Figure FDA00039319406100000514
为0时,U得到的
Figure FDA00039319406100000515
才是分类标签,因此保证了U仅能获知查询数据所属的分类,而不能获知除此之外的其他分类标签信息;综上所述,DTreeClassifer分类协议既保证了客户端输入数据及输出结果的安全性也保证了分类模型的安全性,实现了决策树分类器的分类过程的隐私保护。
6.根据权利要求5所述的支持隐私保护的决策树分类服务系统的控制方法,其特征在于,所述分类阶段步骤4中,所述密文比较协议用于实现ElGamal加密数据的比较,用于分类模型中判定结点阈值ni和属性值xi的比较;比较操作是决策树分类器执行分类处理的核心操作,为满足决策树分类服务系统的需要,基于PvtCmp(Private comparison protocol)比较协议,具体为:
计算
Figure FDA00039319406100000516
其中i∈{1,..,t},若存在i∈{1,..,t}使得ci=0成立,则
Figure FDA00039319406100000517
其中x=(x1,...,xt),y=(y1,...,yt)均为二进制形式,t表示x和y的二进制位数,客户端U和云服务器CS输入数据的二进制位数相等;
PvtCmp比较协议由两方参与,U和CS,设U的输入数据为[x]e,[x]gm,CS的输入数据为[y]e,[y]gm,以二进制加密形式表示,二进制位数相等,长度为t,具体包括以下步骤:
步骤4.1,U将加密的输入数据[x]e,[x]gm发送给CS;
步骤4.2,CS接收U的加密的输入数据[x]e,[x]gm,然后从{0,1}中随机选择一个数,记为b1,计算s←1-2b1,然后执行两层循环,外循环次数为t,内循环次数为j<i,i=1,...,t,内循环中先计算xj,yj的异或结果
Figure FDA0003931940610000061
再使用密文转换协议将异或结果
Figure FDA0003931940610000062
转换为
Figure FDA0003931940610000063
接着对异或结果
Figure FDA0003931940610000064
进行求和得到
Figure FDA0003931940610000065
内循环结束后,计算
Figure FDA0003931940610000066
并选择随机值ri将其添加到
Figure FDA0003931940610000067
中得到
Figure FDA0003931940610000068
一次外循环结束得到[ci]e,则t次外循环结束后可得[c]e=([c1],....[ct])e;CS将结果[c]e=([c1],....[ct])e发送给U;
步骤4.3,U接收并解密[c]e,判断是否存在i∈{1,..,t}使得ci=0成立,若存在,则b2=1,否则b2=0;将b2进行加密得到[b2]e并将其发送给CS;
步骤4.4,CS接收[b2]e,计算
Figure FDA0003931940610000069
其中[b]e≡[x<y]e,即若b=1,则x<y,否,则x≥y;
所述步骤4.1-4.4中,U接收[c]e并解密,由于ri的存在,U不能获知其真实值,保证了CS输入数据y的安全性;CS接收U的x和b2,两者皆为密文表示,CS没有私钥无法解密,保证了U中输入数据x和中间数据b2的安全性;运算过程均基于密文操作,因此,该PvtCmp比较协议同时保证了客户端与云服务器相关数据的安全性。
7.根据权利要求6所述的支持隐私保护的决策树分类服务系统的控制方法,其特征在于,所述分类阶段步骤4中所述的密文转换协议用于实现加密数据从一种同态加密到另一种同态加密的数据转换,用于GM同态加密的加密数据到ElGamal同态加密的加密数据的转换,同时保证加密数据的隐私安全;其应用场景为参与方A拥有两个同态加密算法的公钥pk1,pk2以及pk1加密的加密数据[c]1,参与方B拥有相应同态加密算法的私钥sk1,sk2,通过执行密文转换协议,A最终得到pk2加密的加密数据[c]2;在上述过程中,B不会获知任何与A输入数据[c]1其明文数据c相关的信息;
所述密文转换协议在密文比较协议中使用用于实现GM同态加密算法加密的加密数据到ElGamal同态加密算法加密的加密数据的转换,pk1表示GM的公钥pkgm,pk2表示ElGamal的公钥pke,[c]1表示GM加密的加密数据,其中c表示
Figure FDA00039319406100000610
CN201910142676.7A 2019-02-26 2019-02-26 支持隐私保护的决策树分类服务系统及方法 Active CN110008717B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910142676.7A CN110008717B (zh) 2019-02-26 2019-02-26 支持隐私保护的决策树分类服务系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910142676.7A CN110008717B (zh) 2019-02-26 2019-02-26 支持隐私保护的决策树分类服务系统及方法

Publications (2)

Publication Number Publication Date
CN110008717A CN110008717A (zh) 2019-07-12
CN110008717B true CN110008717B (zh) 2023-04-11

Family

ID=67166039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910142676.7A Active CN110008717B (zh) 2019-02-26 2019-02-26 支持隐私保护的决策树分类服务系统及方法

Country Status (1)

Country Link
CN (1) CN110008717B (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598438B (zh) * 2019-07-19 2023-05-30 福州大学 基于深度卷积神经网络的云中保护外包数据隐私保护系统
CN110445797B (zh) * 2019-08-15 2021-08-13 湖北工业大学 一种具有隐私保护的两方多维数据比较方法和系统
CN110598443A (zh) * 2019-09-12 2019-12-20 卓尔智联(武汉)研究院有限公司 基于隐私保护的数据处理装置、方法及可读存储介质
CN110648218A (zh) * 2019-09-12 2020-01-03 卓尔智联(武汉)研究院有限公司 基于隐私保护的信贷风控系统及方法、计算机装置
US11271958B2 (en) * 2019-09-20 2022-03-08 International Business Machines Corporation Efficient unsupervised anomaly detection on homomorphically encrypted data
CN110837657B (zh) * 2019-11-06 2023-03-14 腾讯云计算(北京)有限责任公司 数据处理方法、客户端、服务器及存储介质
CN111259440B (zh) * 2020-01-14 2022-04-19 中国人民解放军国防科技大学 一种针对云外包数据的隐私保护决策树分类方法
CN111526148B (zh) * 2020-04-26 2022-02-25 中山大学 一种云计算环境下加密音频的安全去噪系统及方法
CN111783124B (zh) * 2020-07-07 2024-05-17 矩阵元技术(深圳)有限公司 基于隐私保护的数据处理方法、装置和服务器
CN113972984B (zh) * 2020-07-24 2024-03-19 中国移动通信集团浙江有限公司 ElGamal密文等价判断方法及装置
CN111967514B (zh) * 2020-08-14 2023-11-17 安徽大学 一种基于数据打包的隐私保护决策树的样本分类方法
CN112104446A (zh) * 2020-09-03 2020-12-18 哈尔滨工业大学 一种基于同态加密的多方联合机器学习方法和系统
CN112199706B (zh) * 2020-10-26 2022-11-22 支付宝(杭州)信息技术有限公司 基于多方安全计算的树模型的训练方法和业务预测方法
CN112288757B (zh) * 2020-10-30 2023-09-19 中山大学 一种基于数据打包技术的加密域图像分割优化方法
CN112231737B (zh) * 2020-11-05 2023-08-22 深圳技术大学 数据安全比较协议实现方法、系统、电子装置及存储介质
CN112347495B (zh) * 2020-11-15 2023-05-26 北京物资学院 一种基于区块链的可信隐私智能服务计算系统及方法
CN112711767B (zh) * 2021-01-13 2023-12-22 湖南大学 一种可验证且隐私保护的支持向量机分类方法
CN112822005B (zh) * 2021-02-01 2022-08-12 福州大学 基于同态加密的安全迁移学习系统
CN113127925B (zh) * 2021-03-11 2022-12-16 西安电子科技大学 用户与服务提供商决策树隐私分类服务方法、系统及应用
CN113221155B (zh) * 2021-05-29 2022-07-01 合肥学院 一种多层级与多等级加密的云储存系统
CN113343277B (zh) * 2021-07-02 2023-12-29 上海科技大学 一种安全高效的委托隐私数据类别预测的方法
CN115021900B (zh) * 2022-05-11 2024-05-03 电子科技大学 分布式梯度提升决策树实现全面隐私保护的方法
CN115242444B (zh) * 2022-06-22 2023-08-01 暨南大学 一种可验证的隐私保护线性回归方法和系统
CN114817999B (zh) * 2022-06-28 2022-09-02 北京金睛云华科技有限公司 一种基于多密钥同态加密的外包隐私保护方法和设备
CN115587139B (zh) * 2022-11-03 2024-03-22 国网江苏省电力有限公司营销服务中心 一种基于同态加密的分布式隐私保护分类方法及系统
CN115801449B (zh) * 2023-01-09 2023-05-26 深圳市迪博企业风险管理技术有限公司 风险评估数据的隐私保护方法、系统和可读存储介质
CN116305187B (zh) * 2023-01-14 2023-09-01 北京惠企易点通科技有限公司 一种基于混合加密的决策流模型计算方法及装置
CN117349898B (zh) * 2023-12-05 2024-03-08 中国电子科技集团公司第十研究所 一种访问模式隐藏的密文k近邻查询方法与系统
CN117725620B (zh) * 2024-02-07 2024-04-30 蓝象智联(杭州)科技有限公司 一种基于决策树的分类结果公开验证隐私保护方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106534313A (zh) * 2016-11-17 2017-03-22 浙江工商大学 面向云端数据发布保护安全及隐私的频度测定方法和系统
WO2018045568A1 (zh) * 2016-09-09 2018-03-15 深圳大学 一种面向云存储服务平台的访问控制方法及其系统
CN108809628A (zh) * 2018-06-13 2018-11-13 哈尔滨工业大学深圳研究生院 基于安全多方下的时间序列异常检测方法与系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018045568A1 (zh) * 2016-09-09 2018-03-15 深圳大学 一种面向云存储服务平台的访问控制方法及其系统
CN106534313A (zh) * 2016-11-17 2017-03-22 浙江工商大学 面向云端数据发布保护安全及隐私的频度测定方法和系统
CN108809628A (zh) * 2018-06-13 2018-11-13 哈尔滨工业大学深圳研究生院 基于安全多方下的时间序列异常检测方法与系统

Also Published As

Publication number Publication date
CN110008717A (zh) 2019-07-12

Similar Documents

Publication Publication Date Title
CN110008717B (zh) 支持隐私保护的决策树分类服务系统及方法
Abd El-Latif et al. Secure data encryption based on quantum walks for 5G Internet of Things scenario
Bonawitz et al. Practical secure aggregation for privacy-preserving machine learning
Liu et al. An efficient privacy-preserving outsourced calculation toolkit with multiple keys
CN110011784B (zh) 支持隐私保护的knn分类服务系统及方法
CN113688999B (zh) 一种横向联邦xgboost决策树的训练方法
CN111586000B (zh) 一种全代理同态重加密传输系统及其运行机制
CN103873236B (zh) 一种可搜索加密方法及设备
CN110635909B (zh) 一种基于属性的抗合谋攻击的代理重加密方法
Jin et al. A secure and lightweight data access control scheme for mobile cloud computing
Jayapandian et al. Secure and efficient online data storage and sharing over cloud environment using probabilistic with homomorphic encryption
CN110190945A (zh) 基于多加密的线性回归隐私保护方法及系统
Zhang et al. Feacs: A flexible and efficient access control scheme for cloud computing
Fan et al. PPMCK: Privacy-preserving multi-party computing for K-means clustering
CN112182660A (zh) 一种数据排序方法及装置
Qiu et al. Categorical quantum cryptography for access control in cloud computing
Qin et al. Simultaneous authentication and secrecy in identity-based data upload to cloud
Wang et al. Privacy preserving computations over healthcare data
Rong et al. Privacy‐Preserving k‐Means Clustering under Multiowner Setting in Distributed Cloud Environments
Aljafer et al. A brief overview and an experimental evaluation of data confidentiality measures on the cloud
CN110661771A (zh) 一种抵抗差分攻击的安全智能电网访问控制方法及系统
Zhan et al. Improved proxy re-encryption with delegatable verifiability
Zhou et al. A survey of security aggregation
Xu et al. Revisiting secure computation using functional encryption: Opportunities and research directions
Kerschbaum Oblivious outsourcing of garbled circuit generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant