CN113127925A - 用户与服务提供商决策树隐私分类服务方法、系统及应用 - Google Patents

用户与服务提供商决策树隐私分类服务方法、系统及应用 Download PDF

Info

Publication number
CN113127925A
CN113127925A CN202110264710.5A CN202110264710A CN113127925A CN 113127925 A CN113127925 A CN 113127925A CN 202110264710 A CN202110264710 A CN 202110264710A CN 113127925 A CN113127925 A CN 113127925A
Authority
CN
China
Prior art keywords
user
decision tree
classification
server
service provider
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110264710.5A
Other languages
English (en)
Other versions
CN113127925B (zh
Inventor
马立川
彭佳怡
裴庆祺
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INNER MONGOLIA AEROSPACE POWER MACHINERY TESTING INSTITUTE
Xi'an Xidian Lianrong Technology Co ltd
Xidian University
Original Assignee
INNER MONGOLIA AEROSPACE POWER MACHINERY TESTING INSTITUTE
Xi'an Xidian Lianrong Technology Co ltd
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INNER MONGOLIA AEROSPACE POWER MACHINERY TESTING INSTITUTE, Xi'an Xidian Lianrong Technology Co ltd, Xidian University filed Critical INNER MONGOLIA AEROSPACE POWER MACHINERY TESTING INSTITUTE
Priority to CN202110264710.5A priority Critical patent/CN113127925B/zh
Publication of CN113127925A publication Critical patent/CN113127925A/zh
Application granted granted Critical
Publication of CN113127925B publication Critical patent/CN113127925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于数据隐私保护技术领域,公开了一种用户与服务提供商决策树隐私分类服务方法、系统及应用,所述用户与决策树隐私分类服务方法服务提供商通过已有数据库训练出决策树分类模型,并利用该模型为用户提供分类服务;参与用户是半可信的,用户向服务器提供用于分类的数据,经过计算后由服务器端返回分类结果。由于在决策树分类模型混淆阶段不存在服务提供商与用户的交互,同时根据基于布尔共享的隐私比较以及1‑out‑of‑n不经意传输协议的安全性,可以得出本发明能够很好地抵制服务商变为“诚实好奇”恶意攻击者的情形。同时当用户变为“诚实好奇”恶意攻击者时,本发明中所提出的隐私分类服务协议仍然是安全的。

Description

用户与服务提供商决策树隐私分类服务方法、系统及应用
技术领域
本发明属于数据隐私保护技术领域,尤其涉及一种用户与服务提供商决策树隐私分类服务方法、系统及应用。
背景技术
目前:随着信息化和网络化进程的加快以及嵌入式设备的普及,物联网(Internetof Things,IoT)技术已经成为学术界和工业界的研究热点。作为联接网络空间和物理世界的“桥梁”,物联网已经在智能医疗、智慧城市、无人驾驶等与民生息息相关的领域扮演了越来越重要的角色。数以亿计的物联网终端设备持续对其所处的环境状态进行捕捉并源源不断地产生诸如日志、声音、视频等多样化的海量数据。然而,由于物联网设备是计算、通信、存储等资源受限的小型设备,其本身难以执行复杂的运算。为此,一般将物联网终端产生的海量数据上传到云计算中心,利用大数据分析技术对数据中蕴含的价值进行充分挖掘。在此背景下,便产生了“物联网大数据”的概念。与此同时,能够从多样化数据中进行模式挖掘与特征提取的机器学习算法已经被成功地应用于语音视频分析、自然语言处理、趋势预测等领域,其已经构成了大数据分析技术的重要组成部分。其中,基于规则空间划分的决策树分类算法因其易于实现和高效性,已经成为机器学习中应用最为广泛的分类算法之一。在物联网大数据中,往往采用“机器学习即服务”的方式来对用户提供分类服务,即云数据中心将来自于物联网终端设备的海量数据进行汇聚并进行训练得到最终的决策树分类模型,然后通过该模型对外提供分类服务。
针对这种情况,一些技术在决策树分类的过程中加入了隐私保护的考虑。然而,现有的几种不同类型方案都存在各自的一些问题。如现有技术一将决策树中根据每一个内部节点所定义的阈值对决策树从根节点到叶子节点的路径进行编码,并将路径的编码与叶子节点所定义的类别建立映射,此时,可以将决策树路径选取问题转化为以路径编码为关键词的搜索问题。然而,该技术泄露了决策树的整体结构,并且难以处理内部节点所定义的阈值为非整数的情况。现有技术二给出了包括决策树模型在内的多种隐私分类方法,其采用了全同态加密方法,故给服务提供商和用户带来了巨大的计算负担。现有技术三则是对上述方法进行了改进,其方案仅需要利用加法同态加密即可。其中,现有技术二和现有技术三的技术复杂度均取决于决策树内部节点的数量,当决策树规模变大时,便变得不实用。现有技术四则是引入安全多方计算框架,将混淆电路与不经意传输协议相结合,使得决策树隐私分类服务的复杂度只与决策树的深度相关。但在现有技术四中每次迭代的需要引入多个混淆电路的计算,故其实用性仍然受到限制。
通过上述分析,现有技术存在的问题及缺陷为:现有的决策树隐私分类服务实现过程复杂,开销较大,需要额外的第三方设备辅助,针对决策树模型保护的问题没有提出很好的解决办法。
解决上述技术问题的难度:可搜索加密技术带来的高计算复杂度问题,可以在基于安全多方计算的方案中得到降低,但仍存在一些问题带来较高的计算开销和网络要求。
解决上述技术问题的意义:若能采用一种便捷的方法处理数据,完成决策树隐私分类服务,达到数据加密同等的效果而不需要巨大的额外开销,则能在保证网络算力宽裕的前提下,同时保护决策树分类模型参数及结构特征和用户需要进行分类的特征数据。
发明内容
针对现有技术存在的问题,本发明提供了一种用户与服务提供商决策树隐私分类服务方法、系统及应用。
本发明是这样实现的,一种用户与服务提供商决策树隐私分类服务方法,所述用户与服务提供商决策树隐私分类服务方法包括:服务提供商通过已有数据库训练出决策树分类模型,并利用该模型为用户提供分类服务;参与用户是半可信的,用户向服务器提供用于分类的数据,经过计算后由服务器端返回分类结果。
进一步,所述用户与服务提供商决策树隐私分类服务方法具体包括以下步骤:
步骤一,服务器根据已有数据,训练决策树分类模型;
步骤二,建立服务器和用户的网络通信环境;
步骤三,用户向服务器发送分类申请;
步骤四,采用随机置换的方法,令服务器对决策树结构进行混淆;
步骤五,根据用户所输入的特征向量,以及服务器提供的决策树,使用布尔共享电路进行决策树的遍历;
步骤六,通过与服务提供商执行不经意传输,用户获取隐私分类的结果
进一步,所述步骤四采用随机置换的方法,令服务器对决策树结构进行混淆的方法具体包括:首先要根据决策树分类模型内部节点的标号序列IV0={1,...,m},其中将根节点的序号标为1,按照广度优先搜索的原则逐层按从左到右的顺序依次对内部节点进行编号,由标号序列IV0所确定的内部节点序列记为V0,那么将V0中每个内部节点所对应的属性标号序列和阈值序列分别记为LX0和W0,其中LX0={I(v0,k):k=1,...,m},W0={w(v0,k):k=1,...,m},此时,决策树分类模型T由IV0,LX0和W0唯一确定,即可以看作函数T[IV0,LX0,W0]:x∈Rd→{z1,...,zn};此处采用随机置换的方法,通过的随机置换对进行混淆,保护树形结构不被泄露。定义函数δr为IV0的随机置换:δr:IV0→IVr,由IVr所确定的内部节点序列表示为Vr,那么由Vr中内部节点所确定的属性编号序列LXr={I(Vr,k):k=1,...,m};此时,通过作用在IV0上的随机置换函数δr将T[IV0,LX0,W0]进行混淆得到的新决策树分类模型T[IVr,LXr,Wr];对任意的用户数据x∈Rd,利用原始分类模型T[IV0,LX0,W0]进行分类时,根据IV0,LX0和W0,将x映射为σx∈{0,1}m,此时定义函数
Figure BDA0002971870000000041
σ∈{0,1}m→{1,...,n}表示决策树路径σ与分类标号之间的映射;而利用经过混淆后的决策树分类模型T[IVr,LXr,Wr]进行分类时,x被φr映射为σrx∈{0,1}m,其可以看作σx在函数δr作用下的一个置换;用户在请求分类服务后,φr与LXr可以由服务提供商发送给请求用户。
进一步,所述步骤五根据用户所输入的特征向量,以及服务器提供的决策树,使用布尔共享电路进行决策树的遍历,用户C提交隐私分类服务请求后,服务提供商S将φr与LXr发送给用户C;用户C将根据LXr所确定的属性标号,选择对应的属性值与服务器提供商拥有的阈值序列Wr中对应的阈值进行比较,进而确定最终的决策路径σrx∈{0,1}m;随后可以通过公开的函数φr得到数据x所对应的类别标号;在上述过程中,对于LXr中的任意属性标号τj(j=1,...,m),需要
Figure BDA0002971870000000042
与对应的wj进行比较,如果
Figure BDA0002971870000000043
σrx,j=1,否则σrx,j=0。此时,用户C拥有
Figure BDA0002971870000000044
服务提供商S拥有wj;在实现基于布尔共享的隐私比较时,用户C将
Figure BDA0002971870000000045
转化为长度为l的二进制表示
Figure BDA0002971870000000046
然后随机产生长度为l的比特串
Figure BDA0002971870000000047
并令
Figure BDA0002971870000000048
此时,
Figure BDA0002971870000000049
Figure BDA00029718700000000410
就构成了
Figure BDA00029718700000000411
的布尔共享,其中,用户C将
Figure BDA00029718700000000412
保留,并将
Figure BDA00029718700000000413
发送给服务提供商S;按照同样的方式,S得到[wj],[wj]S和[wj]C,并将[wj]C发送给用户C;具体的,对于任意j=1,...,m,服务提供商S输入
Figure BDA00029718700000000414
[wj]S和辅助比特rS;用户输入
Figure BDA00029718700000000415
[wj]C和rC,其中
Figure BDA00029718700000000416
服务提供商S计算
Figure BDA00029718700000000417
用户C计算
Figure BDA00029718700000000418
服务提供商S将计算好的rs发送给用户C后,用户C计算
Figure BDA00029718700000000419
其中q=1,2,...,m;并将以上步骤进行m次,便得到了σrx∈{0,1}m
进一步,所述步骤六通过与服务提供商执行不经意传输,用户获取隐私分类的结果。经过基于布尔共享的隐私比较之后,用户C获得了数据x所对应的叶子节点标号,记为γ;而对于服务提供商S而言,叶子节点集合Z={z1,...,zn}中的每个叶子节点对应一个类别,假设zj(j=1,...,n)为一个长度为的比特串,即zj∈{0,1}λ。在最终获取分类结果时,通过引入能快速实现的哈希函数将不经意传输过程
Figure BDA0002971870000000051
转化为
Figure BDA0002971870000000052
其中
Figure BDA0002971870000000053
表示向上取整操作;达到用户C希望在S无法知晓γ的前提下获取zγ,而用户只能得到zγ而无法获取其余叶子节点所对应的类别信息的作用。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:服务提供商通过已有数据库训练出决策树分类模型,并利用该模型为用户提供分类服务;参与用户是半可信的,用户向服务器提供用于分类的数据,经过计算后由服务器端返回分类结果。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:服务提供商通过已有数据库训练出决策树分类模型,并利用该模型为用户提供分类服务;参与用户是半可信的,用户向服务器提供用于分类的数据,经过计算后由服务器端返回分类结果。
本发明的另一目的在于提供一种信息数据处理终端,,所述信息数据处理终端用于实现所述的用户与服务提供商决策树隐私分类服务方法。
本发明的另一目的在于提供一种实施所述用户与服务提供商决策树隐私分类服务方法的用户与服务提供商决策树隐私分类服务系统,所述的用户与服务提供商决策树隐私分类服务方法包括:
模型训练模块,用于实现服务器根据已有数据,训练决策树分类模型;
网络通信环境建立模块,用于建立服务器和用户的网络通信环境;
分类申请模块,用于实现用户向服务器发送分类申请;
结构混淆模块,用于采用随机置换的方法,令服务器对决策树结构进行混淆;
决策树遍历模块,用于根据用户所输入的特征向量,以及服务器提供的决策树,使用布尔共享电路进行决策树的遍历;
分类结果获取模块,用于通过与服务提供商执行不经意传输,用户获取隐私分类的结果。
本发明的另一目的在于提供一种物联网设备数据隐私保护终端,所述联网设备数据隐私保护终端用于实现所述的用户与服务提供商决策树隐私分类服务方法;所述物联网设备数据隐私保护终端为智能医疗终端、智慧城市终端、无人驾驶终端。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明将决策树分类模型与安全多方计算框架相结合,针对“诚实好奇”的恶意攻击者,通过决策树分类模型混淆、基于布尔共享的隐私比较和基于不经意传输的隐私分类结果三个阶段,能够提供分类服务过程中同时保护服务提供商决策树分类模型参数及结构特征,并保护用户需要进行分类的特征数据。由于在决策树分类模型混淆阶段不存在服务提供商与用户的交互,同时根据基于布尔共享的隐私比较以及1-out-of-n不经意传输协议的安全性,可以得出本发明能够很好地抵制服务商变为“诚实好奇”恶意攻击者的情形。同时当用户变为“诚实好奇”恶意攻击者时,本发明中所提出的隐私分类服务协议仍然是安全的。
表1是决策树隐私分类服务方法与背景技术提到的三种技指标对比,以下简称本发明,技术三,技术四。对比使用公开数据集得到的决策树分类模型进行分类时的服务提供情况。可见本发明时间效率高和计算复杂度低的特点有明显体现。
表1
Figure BDA0002971870000000061
Figure BDA0002971870000000071
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的用户与服务提供商决策树隐私分类服务方法流程图。
图2是本发明实施例提供的用户与服务提供商决策树隐私分类服务系统的结构示意图;
图2中:1、模型训练模块;2、网络通信环境建立模块;3、分类申请模块;4、结构混淆模块;5、决策树遍历模块;6、分类结果获取模块。
图3是本发明实施例提供的应用场景示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有的决策树分类服务技术计算开销及通信开销高、决策树模型参数无法得到保护的问题,本发明采用决策树隐私分类服务方法基于安全多方计算,利用数据混淆及秘密共享的思想提供了一种用户与服务提供商决策树隐私分类服务方法、系统及应用,在提供分类服务过程中保护用户及服务提供商双方的数据隐私。下面结合附图对本发明作详细的描述。
如图1所示,本发明提供的用户与服务提供商决策树隐私分类服务方法包括以下步骤:
S101:服务器根据已有数据,训练决策树分类模型;
S102:建立服务器和用户的网络通信环境;
S103:用户向服务器发送分类申请;
S104:采用随机置换的方法,令服务器对决策树结构进行混淆;
S105:根据用户所输入的特征向量,以及服务器提供的决策树,使用布尔共享电路进行决策树的遍历;
S106:通过与服务提供商执行不经意传输,用户获取隐私分类的结果。
本发明提供的用户与服务提供商决策树隐私分类服务方业内的普通技术人员还可以采用其他的步骤实施,图1的本发明提供的用户与服务提供商决策树隐私分类服务方仅仅是一个具体实施例而已。
如图2所示,本发明提供的用户与服务提供商决策树隐私分类服务系统包括:
模型训练模块1,用于实现服务器根据已有数据,训练决策树分类模型;
网络通信环境建立模块2,用于建立服务器和用户的网络通信环境;
分类申请模块3,用于实现用户向服务器发送分类申请;
结构混淆模块4,用于采用随机置换的方法,令服务器对决策树结构进行混淆;
决策树遍历模块5,用于根据用户所输入的特征向量,以及服务器提供的决策树,使用布尔共享电路进行决策树的遍历;
分类结果获取模块6,用于通过与服务提供商执行不经意传输,用户获取隐私分类的结果。
下面结合附图对本发明的技术方案作进一步的描述。
如图3所示,本发明的应用场景是服务提供商向用户提供决策树隐私分类服务的过程,考虑了云计算中典型的Server-Client模型,Server位于云计算中心,其主要负责来自于物联网设备的数据,并对数据进行标记。然后,充分利用云数据中心的计算和存储能力,对所收集的数据进行训练,得到树形结构的决策树分类模型,并利用该模型为用户提供分类服务。Client则为普通用户,其可以向Server提供用于分类的数据,经过计算后由Server端返回分类结果。
本发明实施例提供的决策树隐私分类方法具体包括以下步骤:
步骤一:服务器根据已有数据,训练决策树分类模型;
步骤二:建立服务器和用户的网络通信环境;
步骤三:用户向服务器发送分类申请;
步骤四:采用随机置换的方法,令服务器对决策树结构进行混淆;令服务器对决策树结构进行混淆的方法具体包括:首先要根据决策树分类模型内部节点的标号序列IV0={1,...,m},其中将根节点的序号标为1,按照广度优先搜索的原则逐层按从左到右的顺序依次对内部节点进行编号,由标号序列IV0所确定的内部节点序列记为V0,那么将V0中每个内部节点所对应的属性标号序列和阈值序列分别记为LX0和W0,其中LX0={I(v0,k):k=1,...,m},W0={w(v0,k):k=1,...,m},此时,决策树分类模型T由IV0,LX0和W0唯一确定,即可以看作函数T[IV0,LX0,W0]:x∈Rd→{z1,...,zn}。此处采用随机置换的方法,通过的随机置换对进行混淆,从而保护树形结构不被泄露。定义函数δr为IV0的随机置换:δr:IV0→IVr,由IVr所确定的内部节点序列表示为Vr,那么由Vr中内部节点所确定的属性编号序列LXr={I(Vr,k):k=1,...,m}。此时,通过作用在IV0上的随机置换函数δr将T[IV0,LX0,W0]进行混淆得到的新决策树分类模型T[IVr,LXr,Wr]。对任意的用户数据x∈Rd,利用原始分类模型T[IV0,LX0,W0]进行分类时,根据IV0,LX0和W0,可以将x映射为σx∈{0,1}m,此时定义函数
Figure BDA0002971870000000101
σ∈{0,1}m→{1,...,n}表示决策树路径σ与分类标号之间的映射。而利用经过混淆后的决策树分类模型T[IVr,LXr,Wr]进行分类时,x被φr映射为σrx∈{0,1}m,其可以看作σx在函数δr作用下的一个置换。用户在请求分类服务后,φr与LXr可以由服务提供商发送给请求用户。
步骤五:根据用户所输入的特征向量,以及服务器提供的决策树,使用布尔共享电路进行决策树的遍历。用户C提交隐私分类服务请求后,服务提供商S将φr与LXr发送给用户C。接下来,用户C将根据LXr所确定的属性标号,选择对应的属性值与服务器提供商拥有的阈值序列Wr中对应的阈值进行比较,进而确定最终的决策路径σrx∈{0,1}m。随后可以通过公开的函数φr得到数据x所对应的类别标号。在上述过程中,对于LXr中的任意属性标号τj(j=1,...,m),需要
Figure BDA0002971870000000102
与对应的wj进行比较,如果
Figure BDA0002971870000000103
σrx,j=1,否则σrx,j=0。此时,用户C拥有
Figure BDA0002971870000000104
服务提供商S拥有wj。在实现基于布尔共享的隐私比较时,用户C将
Figure BDA0002971870000000105
转化为长度为l的二进制表示
Figure BDA0002971870000000106
然后随机产生长度为l的比特串
Figure BDA0002971870000000107
并令
Figure BDA0002971870000000108
此时,
Figure BDA0002971870000000109
Figure BDA00029718700000001010
就构成了
Figure BDA00029718700000001011
的布尔共享,其中,用户C将
Figure BDA00029718700000001012
保留,并将
Figure BDA00029718700000001013
发送给服务提供商S。按照同样的方式,S得到[wj],[wj]S和[wj]C,并将[wj]C发送给用户C。具体的,对于任意j=1,...,m,服务提供商S输入
Figure BDA00029718700000001014
[wj]S和辅助比特rS;用户输入
Figure BDA00029718700000001015
[wj]C和rC,其中
Figure BDA00029718700000001016
服务提供商S计算
Figure BDA00029718700000001017
用户C计算
Figure BDA00029718700000001018
服务提供商S将计算好的rs发送给用户C后,用户C计算
Figure BDA00029718700000001019
其中q=1,2,...,m。并将以上步骤进行m次,便得到了σrx∈{0,1}m
步骤六:服务提供商和用户通过不经意传输,进行隐私分类结果的获取。经过基于布尔共享的隐私比较之后,用户C获得了数据x所对应的叶子节点标号,记为γ。而对于服务提供商S而言,叶子节点集合Z={z1,...,zn}中的每个叶子节点对应一个类别,假设zj(j=1,...,n)为一个长度为的比特串,即zj∈{0,1}λ。在最终获取分类结果时,通过引入能快速实现的哈希函数将不经意传输过程
Figure BDA0002971870000000111
转化为
Figure BDA0002971870000000112
其中
Figure BDA0002971870000000113
表示向上取整操作。该步骤可以达到用户C希望在S无法知晓γ的前提下获取zγ,而用户只能得到zγ而无法获取其余叶子节点所对应的类别信息的作用。
下面结合具体实验对本发明的技术效果作详细的描述。
本发明通过C++实现,代码运行于装有Ubuntu 18.04的虚拟机上,将该虚拟机的内存和硬盘容量分别设置为16GB和50GB,处理器个数为6。对于实现过程中所涉及的大数运算和哈希运算,使用了开源的GMP库和Openssl库。此外,所有的数据均用长度为64的比特串表示,前48比特表示整数位,后16比特表示小数位。为了得到真实的决策树分类模型,本实验采用了包括ECG、Nursery、Breast-cancer、Housing、Credit-screening及Spambase六个数据集,其均来自于加州大学欧文分校提出的机器学习标准测试数据集UCI。其中,通过数据集Housing和Spambase训练得到的决策树分类模型中所包含的内部节点数量及其深度要远大于其余4个数据集,即完成一次隐私分类服务所需的时间要远大于其余分类模型。
实验中,无论经由数据集Breasecancer、Nursery、ECG和Credit-screening训练得出的小型决策树,还是经由数据集Housing和Spambase训练的出的大型决策树,本发明中提出的方法均能在实验中能将运行时间控制在0.5秒左右。本发明提出的方法在进行比较运算时是使用了布尔共享的思路,使得比较运算效率较高,因此,即使在决策树分类模型规模变大时,本发明提出的方法仍能高效地完成隐私分类服务。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本发明领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种用户与服务提供商决策树隐私分类服务方法,其特征在于,所述用户与服务提供商决策树隐私分类服务方法包括:服务提供商通过已有数据库训练出决策树分类模型,并利用该模型为用户提供分类服务;参与用户是半可信的,用户向服务器提供用于分类的数据,经过计算后由服务器端返回分类结果。
2.如权利要求1所述的用户与服务提供商决策树隐私分类服务方法,其特征在于,所述用户与服务提供商决策树隐私分类服务方法具体包括以下步骤:
步骤一,服务器根据已有数据,训练决策树分类模型;
步骤二,建立服务器和用户的网络通信环境;
步骤三,用户向服务器发送分类申请;
步骤四,采用随机置换的方法,令服务器对决策树结构进行混淆;
步骤五,根据用户所输入的特征向量,以及服务器提供的决策树,使用布尔共享电路进行决策树的遍历;
步骤六,通过与服务提供商执行不经意传输,用户获取隐私分类的结果。
3.如权利要求2所述的用户与服务提供商决策树隐私分类服务方法,其特征在于,所述步骤四采用随机置换的方法,令服务器对决策树结构进行混淆的方法具体包括:首先要根据决策树分类模型内部节点的标号序列IV0={1,...,m},其中将根节点的序号标为1,按照广度优先搜索的原则逐层按从左到右的顺序依次对内部节点进行编号,由标号序列IV0所确定的内部节点序列记为V0,那么将V0中每个内部节点所对应的属性标号序列和阈值序列分别记为LX0和W0,其中LX0={I(v0,k):k=1,...,m},W0={w(v0,k):k=1,...,m},此时,决策树分类模型T由IV0,LX0和W0唯一确定,即可以看作函数T[IV0,LX0,W0]:x∈Rd→{z1,...,zn};此处采用随机置换的方法,通过的随机置换对进行混淆,保护树形结构不被泄露;定义函数δr为IV0的随机置换:δr:IV0→IVr,由IVr所确定的内部节点序列表示为Vr,那么由Vr中内部节点所确定的属性编号序列LXr={I(Vr,k):k=1,...,m};此时,通过作用在IV0上的随机置换函数δr将T[IV0,LX0,W0]进行混淆得到的新决策树分类模型T[IVr,LXr,Wr];对任意的用户数据x∈Rd,利用原始分类模型T[IV0,LX0,W0]进行分类时,根据IV0,LX0和W0,将x映射为σx∈{0,1}m,此时定义函数
Figure FDA0002971869990000021
表示决策树路径σ与分类标号之间的映射;而利用经过混淆后的决策树分类模型T[IVr,LXr,Wr]进行分类时,x被φr映射为σrx∈{0,1}m,其可以看作σx在函数δr作用下的一个置换;用户在请求分类服务后,φr与LXr可以由服务提供商发送给请求用户。
4.如权利要求2所述的用户与服务提供商决策树隐私分类服务方法,其特征在于,所述步骤五根据用户所输入的特征向量,以及服务器提供的决策树,使用布尔共享电路进行决策树的遍历,用户C提交隐私分类服务请求后,服务提供商S将φr与LXr发送给用户C;用户C将根据LXr所确定的属性标号,选择对应的属性值与服务器提供商拥有的阈值序列Wr中对应的阈值进行比较,进而确定最终的决策路径σrx∈{0,1}m;随后可以通过公开的函数φr得到数据x所对应的类别标号;在上述过程中,对于LXr中的任意属性标号τj(j=1,...,m),需要
Figure FDA0002971869990000022
与对应的wj进行比较,如果
Figure FDA0002971869990000023
σrx,j=1,否则σrx,j=0,此时,用户C拥有
Figure FDA0002971869990000024
服务提供商S拥有wj;在实现基于布尔共享的隐私比较时,用户C将
Figure FDA0002971869990000025
转化为长度为l的二进制表示
Figure FDA0002971869990000026
然后随机产生长度为l的比特串
Figure FDA0002971869990000027
并令
Figure FDA0002971869990000028
此时,
Figure FDA0002971869990000029
Figure FDA00029718699900000210
就构成了
Figure FDA00029718699900000211
的布尔共享,其中,用户C将
Figure FDA00029718699900000212
保留,并将
Figure FDA00029718699900000213
发送给服务提供商S;按照同样的方式,S得到[wj],[wj]S和[wj]C,并将[wj]C发送给用户C;具体的,对于任意j=1,...,m,服务提供商S输入
Figure FDA00029718699900000214
[wj]S和辅助比特rS;用户输入
Figure FDA00029718699900000215
[wj]C和rC,其中
Figure FDA00029718699900000216
服务提供商S计算
Figure FDA00029718699900000217
用户C计算
Figure FDA00029718699900000218
服务提供商S将计算好的rs发送给用户C后,用户C计算
Figure FDA0002971869990000031
其中q=1,2,...,m;并将以上步骤进行m次,便得到了σrx∈{0,1}m
5.如权利要求2所述的用户与服务提供商决策树隐私分类服务方法,其特征在于,所述步骤六通过与服务提供商执行不经意传输,用户获取隐私分类的结果,经过基于布尔共享的隐私比较之后,用户C获得了数据x所对应的叶子节点标号,记为γ;而对于服务提供商S而言,叶子节点集合Z={z1,...,zn}中的每个叶子节点对应一个类别,假设zj(j=1,...,n)为一个长度为的比特串,即zj∈{0,1}λ,在最终获取分类结果时,通过引入能快速实现的哈希函数将不经意传输过程
Figure FDA0002971869990000032
转化为
Figure FDA0002971869990000033
其中
Figure FDA0002971869990000034
表示向上取整操作;达到用户C希望在S无法知晓γ的前提下获取zγ,而用户只能得到zγ而无法获取其余叶子节点所对应的类别信息的作用。
6.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:服务提供商通过已有数据库训练出决策树分类模型,并利用该模型为用户提供分类服务;参与用户是半可信的,用户向服务器提供用于分类的数据,经过计算后由服务器端返回分类结果。
7.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:服务提供商通过已有数据库训练出决策树分类模型,并利用该模型为用户提供分类服务;参与用户是半可信的,用户向服务器提供用于分类的数据,经过计算后由服务器端返回分类结果。
8.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现权利要求1~5任意一项所述的用户与服务提供商决策树隐私分类服务方法。
9.一种实施权利要求1~5任意一项所述用户与服务提供商决策树隐私分类服务方法的用户与服务提供商决策树隐私分类服务系统,其特征在于,所述权利要求1~5任意一项所述的用户与服务提供商决策树隐私分类服务方法包括:
模型训练模块,用于实现服务器根据已有数据,训练决策树分类模型;
网络通信环境建立模块,用于建立服务器和用户的网络通信环境;
分类申请模块,用于实现用户向服务器发送分类申请;
结构混淆模块,用于采用随机置换的方法,令服务器对决策树结构进行混淆;
决策树遍历模块,用于根据用户所输入的特征向量,以及服务器提供的决策树,使用布尔共享电路进行决策树的遍历;
分类结果获取模块,用于通过与服务提供商执行不经意传输,用户获取隐私分类的结果。
10.一种物联网设备数据隐私保护终端,其特征在于,所述联网设备数据隐私保护终端用于实现权利要求1~5任意一项所述的用户与服务提供商决策树隐私分类服务方法;所述物联网设备数据隐私保护终端为智能医疗终端、智慧城市终端、无人驾驶终端。
CN202110264710.5A 2021-03-11 2021-03-11 用户与服务提供商决策树隐私分类服务方法、系统及应用 Active CN113127925B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110264710.5A CN113127925B (zh) 2021-03-11 2021-03-11 用户与服务提供商决策树隐私分类服务方法、系统及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110264710.5A CN113127925B (zh) 2021-03-11 2021-03-11 用户与服务提供商决策树隐私分类服务方法、系统及应用

Publications (2)

Publication Number Publication Date
CN113127925A true CN113127925A (zh) 2021-07-16
CN113127925B CN113127925B (zh) 2022-12-16

Family

ID=76772917

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110264710.5A Active CN113127925B (zh) 2021-03-11 2021-03-11 用户与服务提供商决策树隐私分类服务方法、系统及应用

Country Status (1)

Country Link
CN (1) CN113127925B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113742779A (zh) * 2021-09-18 2021-12-03 湖北工业大学 一种具有隐私保护的服务定制系统与方法
CN114024674A (zh) * 2021-11-23 2022-02-08 支付宝(杭州)信息技术有限公司 两方安全比较的方法及系统
CN114444725A (zh) * 2022-04-06 2022-05-06 阿里巴巴达摩院(杭州)科技有限公司 预训练服务系统及基于预训练服务系统的服务提供方法
CN115967526A (zh) * 2022-10-27 2023-04-14 电子科技大学 针对梯度提升决策树外包推理的隐私保护方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008717A (zh) * 2019-02-26 2019-07-12 东北大学 支持隐私保护的决策树分类服务系统及方法
CN110222527A (zh) * 2019-05-22 2019-09-10 暨南大学 一种隐私保护方法
CN110537191A (zh) * 2017-03-22 2019-12-03 维萨国际服务协会 隐私保护机器学习
CN111065088A (zh) * 2019-10-18 2020-04-24 宇龙计算机通信科技(深圳)有限公司 一种位置获取方法、装置、存储介质及电子设备
US20200167662A1 (en) * 2019-07-01 2020-05-28 Alibaba Group Holding Limited Performing data processing based on decision tree

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110537191A (zh) * 2017-03-22 2019-12-03 维萨国际服务协会 隐私保护机器学习
CN110008717A (zh) * 2019-02-26 2019-07-12 东北大学 支持隐私保护的决策树分类服务系统及方法
CN110222527A (zh) * 2019-05-22 2019-09-10 暨南大学 一种隐私保护方法
US20200167662A1 (en) * 2019-07-01 2020-05-28 Alibaba Group Holding Limited Performing data processing based on decision tree
CN111065088A (zh) * 2019-10-18 2020-04-24 宇龙计算机通信科技(深圳)有限公司 一种位置获取方法、装置、存储介质及电子设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HIROAKI KIKUCHI 等: "Privacy-Preserving Distributed Decision Tree Learning with Boolean Class Attributes", 《2013 IEEE 27TH INTERNATIONAL CONFERENCE ON ADVANCED INFORMATION NETWORKING AND APPLICATIONS (AINA)》 *
LICHUAN MA 等: "Privacy-Preserving Reputation Management for Edge Computing Enhanced Mobile Crowdsensing", 《IEEE TRANSACTIONS ON SERVICES COMPUTING》 *
袁武: "分布式环境中保护隐私数据挖掘方法的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
马立川 等: "高效的决策树隐私分类服务协议", 《通信学报》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113742779A (zh) * 2021-09-18 2021-12-03 湖北工业大学 一种具有隐私保护的服务定制系统与方法
CN113742779B (zh) * 2021-09-18 2024-03-22 湖北工业大学 一种具有隐私保护的服务定制系统与方法
CN114024674A (zh) * 2021-11-23 2022-02-08 支付宝(杭州)信息技术有限公司 两方安全比较的方法及系统
CN114024674B (zh) * 2021-11-23 2024-05-31 支付宝(杭州)信息技术有限公司 两方安全比较的方法及系统
CN114444725A (zh) * 2022-04-06 2022-05-06 阿里巴巴达摩院(杭州)科技有限公司 预训练服务系统及基于预训练服务系统的服务提供方法
WO2023193453A1 (zh) * 2022-04-06 2023-10-12 阿里巴巴达摩院(杭州)科技有限公司 预训练服务系统及基于预训练服务系统的服务提供方法
CN115967526A (zh) * 2022-10-27 2023-04-14 电子科技大学 针对梯度提升决策树外包推理的隐私保护方法
CN115967526B (zh) * 2022-10-27 2024-03-19 电子科技大学 针对梯度提升决策树外包推理的隐私保护方法

Also Published As

Publication number Publication date
CN113127925B (zh) 2022-12-16

Similar Documents

Publication Publication Date Title
CN113127925B (zh) 用户与服务提供商决策树隐私分类服务方法、系统及应用
Gordon et al. Secure two-party computation in sublinear (amortized) time
Boyle et al. Is there an oblivious RAM lower bound?
Blanton et al. Secure and efficient outsourcing of sequence comparisons
Hao et al. Efficient, private and robust federated learning
KR20150052131A (ko) 블룸 필터를 숨기는 콘텐츠에 의한 안전한 개인 데이터베이스 쿼링
Fu et al. A study on the optimization of blockchain hashing algorithm based on PRCA
CN114726823B (zh) 一种基于生成对抗网络的域名生成方法、装置和设备
CN111552849A (zh) 可搜索加密方法、系统、存储介质、车载网、智能电网
Kolesnikov Free IF: How to omit inactive branches and implement S-universal garbled circuit (almost) for free
Lazzeretti et al. Private computing with garbled circuits [applications corner]
Bai et al. Scalable private decision tree evaluation with sublinear communication
CN117910018B (zh) 应用于人工智能中的基于同态加密和明文计算技术的数据计算与交换共享方法
CN113836447B (zh) 一种云平台下的安全轨迹相似性查询方法及系统
Hao et al. Fastsecnet: An efficient cryptographic framework for private neural network inference
Bangare et al. Kernel interpolation-based technique for privacy protection of pluggable data in cloud computing
Zhang et al. Divertible searchable symmetric encryption for secure cloud storage
Jiang et al. Efficient secure and verifiable KNN set similarity search over outsourced clouds
Bai et al. Mostree: Malicious Secure Private Decision Tree Evaluation with Sublinear Communication
Sun et al. Confidentiality‐Preserving Publicly Verifiable Computation Schemes for Polynomial Evaluation and Matrix‐Vector Multiplication
WO2022148087A1 (zh) 编程语言翻译模型的训练方法、装置、设备及存储介质
Zhang et al. Tree‐Based Public Key Encryption with Conjunctive Keyword Search
Wang et al. PrigSim: Towards Privacy-Preserving Graph Similarity Search as a Cloud Service
Duan et al. A searchable encryption scheme with hidden search pattern and access pattern on distributed cloud system
Zhao et al. Privacy-preserving top-k spatio-temporal keyword preference query

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 710071 Xi'an Electronic and Science University, 2 Taibai South Road, Shaanxi, Xi'an

Applicant after: XIDIAN University

Applicant after: Xi'an Lianrong Technology Co.,Ltd.

Applicant after: INNER MONGOLIA AEROSPACE POWER MACHINERY TESTING INSTITUTE

Address before: 710071 Xi'an Electronic and Science University, 2 Taibai South Road, Shaanxi, Xi'an

Applicant before: XIDIAN University

Applicant before: XI'AN XIDIAN LIANRONG TECHNOLOGY Co.,Ltd.

Applicant before: INNER MONGOLIA AEROSPACE POWER MACHINERY TESTING INSTITUTE

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant