CN112016123A - 隐私保护算法的验证方法、装置及电子设备 - Google Patents

隐私保护算法的验证方法、装置及电子设备 Download PDF

Info

Publication number
CN112016123A
CN112016123A CN202010922588.1A CN202010922588A CN112016123A CN 112016123 A CN112016123 A CN 112016123A CN 202010922588 A CN202010922588 A CN 202010922588A CN 112016123 A CN112016123 A CN 112016123A
Authority
CN
China
Prior art keywords
privacy
data set
algorithm
function
privacy protection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010922588.1A
Other languages
English (en)
Other versions
CN112016123B (zh
Inventor
吴若凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010922588.1A priority Critical patent/CN112016123B/zh
Priority to CN202111234174.0A priority patent/CN113886886A/zh
Publication of CN112016123A publication Critical patent/CN112016123A/zh
Application granted granted Critical
Publication of CN112016123B publication Critical patent/CN112016123B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Storage Device Security (AREA)

Abstract

本说明书实施例提供一种隐私保护算法的验证方法、装置及电子设备,根据该方法,获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法,多次调用上述隐私保护算法处理第一隐私仿真数据集,得到多个第一结果,以及多次调用上述隐私保护算法处理第二隐私仿真数据集,得到多个第二结果。构建多个第一结果的累积分布函数,确定每个第二结果针对上述累积分布函数的p值,得到多个p值,并利用上述多个p值构建权衡函数,以利用该权衡函数的图像验证上述隐私保护算法的隐私保护性能。如此能够便捷且准确地对隐私保护算法的隐私保护性能做出决策。

Description

隐私保护算法的验证方法、装置及电子设备
技术领域
本说明书一个或多个实施例涉及隐私保护技术领域,特别涉及一种隐私保护算法的验证方法、装置及电子设备。
背景技术
随着大数据技术的不断发展,数据的隐私保护问题也变得越来越重要。目前来说,通常采用预先设计的隐私保护算法对需要保护隐私的数据进行分析处理。隐私保护算法的性能对隐私保护的效果起着决定性作用,因此,对隐私保护算法性能的验证具有重要的意义。但是,目前并没有通用、简单且直观的对隐私保护算法进行验证的方式。
发明内容
为了解决上述技术问题之一,本说明书一个或多个实施例提供一种隐私保护算法的验证方法、装置及电子设备。
根据第一方面,提供一种隐私保护算法的验证方法,包括:
获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法;所述第一隐私仿真数据集和所述第二隐私仿真数据集为相邻数据集;所述隐私保护算法为差分隐私类的随机算法;
多次调用所述隐私保护算法处理所述第一隐私仿真数据集,得到多个第一结果,以及多次调用所述隐私保护算法处理所述第二隐私仿真数据集,得到多个第二结果;其中,每次调用所述隐私保护算法采用的随机数状态不同;
构建所述多个第一结果的累积分布函数;
确定每个所述第二结果针对所述累积分布函数的p值,得到多个p值;其中,将任一第二结果作为自变量代入所述累积分布函数所得结果与该第二结果的p值之和为1;
构建所述多个p值的互补累积分布函数,作为用于验证所述隐私保护算法的权衡函数;所述权衡函数的图像表征了所述隐私保护算法的隐私保护性能。
可选的,所述累积分布函数为所述多个第一结果的经验分布函数。
可选的,所述权衡函数为1减所述多个p值的经验分布函数。
可选的,所述第一隐私仿真数据集和所述第二隐私仿真数据集通过如下方式得到:
获取基于隐私仿真数据构建的第一隐私仿真数据集;
确定所述第一隐私仿真数据集的多个相邻数据集;
获取所述隐私保护算法所对应的非隐私保护的原始算法;
调用所述原始算法处理所述第一隐私仿真数据集,得到第一处理结果;
调用所述原始算法处理所述多个相邻数据集中的每个相邻数据集,得到每个相邻数据集对应的第二处理结果;
选取与所述第一处理结果的距离值最大的第二处理结果所对应的相邻数据集,作为第二隐私仿真数据集。
可选的,所述距离值包括以下任意一项:
欧式距离值,余弦距离值,曼哈顿距离值,切比雪夫距离值以及汉明距离值。
可选的,所述方法还包括:
获取参考函数;
将所述参考函数的图像与所述权衡函数的图像显示于同一界面的同一坐标系中。
根据第二方面,提供一种隐私保护算法的验证装置,包括:
获取模块,用于获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法;所述第一隐私仿真数据集和所述第二隐私仿真数据集为相邻数据集;所述隐私保护算法为差分隐私类的随机算法;
调用模块,用于多次调用所述隐私保护算法处理所述第一隐私仿真数据集,得到多个第一结果,以及多次调用所述隐私保护算法处理所述第二隐私仿真数据集,得到多个第二结果;其中,每次调用所述隐私保护算法采用的随机数状态不同;
第一构建模块,用于构建所述多个第一结果的累积分布函数;
确定模块,用于确定每个所述第二结果针对所述累积分布函数的p值,得到多个p值;其中,将任一第二结果作为自变量代入所述累积分布函数所得结果与该第二结果的p值之和为1;
第二构建模块,用于构建所述多个p值的互补累积分布函数,作为用于验证所述隐私保护算法的权衡函数;所述权衡函数的图像表征了所述隐私保护算法的隐私保护性能。
可选的,所述累积分布函数为所述多个第一结果的经验分布函数。
可选的,所述权衡函数为1减所述多个p值的经验分布函数。
可选的,所述第一隐私仿真数据集和所述第二隐私仿真数据集通过如下方式得到:
获取基于隐私仿真数据构建的第一隐私仿真数据集;
确定所述第一隐私仿真数据集的多个相邻数据集;
获取所述隐私保护算法所对应的非隐私保护的原始算法;
调用所述原始算法处理所述第一隐私仿真数据集,得到第一处理结果;
调用所述原始算法处理所述多个相邻数据集中的每个相邻数据集,得到每个相邻数据集对应的第二处理结果;
选取与所述第一处理结果的距离值最大的第二处理结果所对应的相邻数据集,作为第二隐私仿真数据集。
可选的,所述距离值包括以下任意一项:
欧式距离值,余弦距离值,曼哈顿距离值,切比雪夫距离值以及汉明距离值。
可选的,所述装置还包括:
参考模块,用于获取参考函数;
显示模块,用于将所述参考函数的图像与所述权衡函数的图像显示于同一界面的同一坐标系中。
根据第三方面,提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一项所述的方法。
根据第四方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第一方面中任一项所述的方法。
本说明书的实施例提供的技术方案可以包括以下有益效果:
本说明书的实施例提供的隐私保护算法的验证方法和装置,通过获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法,多次调用上述隐私保护算法处理第一隐私仿真数据集,得到多个第一结果,以及多次调用上述隐私保护算法处理第二隐私仿真数据集,得到多个第二结果。构建多个第一结果的累积分布函数,确定每个第二结果针对上述累积分布函数的p值,得到多个p值,并利用上述多个p值构建权衡函数,以利用该权衡函数的图像验证上述隐私保护算法的隐私保护性能。从而能够便捷且准确地对隐私保护算法的隐私保护性能做出决策。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本说明书根据一示例性实施例示出的一种隐私保护算法的验证的场景示意图;
图2A是本说明书根据一示例性实施例示出的一种隐私保护算法的验证方法的流程图;
图2B是本说明书根据一示例性实施例示出的另一种隐私保护算法的验证场景示意图;
图3是本说明书根据一示例性实施例示出的另一种隐私保护算法的验证方法的流程图;
图4是本说明书根据一示例性实施例示出的一种隐私保护算法的验证装置的框图;
图5是本说明书根据一示例性实施例示出的另一种隐私保护算法的验证装置的框图;
图6是本说明根据一示例性实施例示出的一种电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
为了便于本领域技术人员更好地理解本说明书实施例的技术方案,首先,对本说明书实施例的基本思想进行简要说明,说明如下:本说明书实施例的技术方案为了实现对待验证的隐私保护算法进行验证,首先提出了零假设和备择假设。其中,零假设具体为上述隐私保护算法的隐私保护性能满足要求,备择假设具体为上述隐私保护算法的隐私保护性能不满足要求。然后,将利用上述隐私保护算法对隐私仿真数据集进行处理的结果作为检验统计量。这时,如果能确定上述零假设为真时,检验统计量的真实概率分布,就可以采用统计学中假设检验的方法对上述隐私保护算法进行验证。
然而,我们无法获知上述零假设为真时,检验统计量的真实概率分布。但是,发明人经过创造性思考发现,可以利用上述隐私保护算法对两个相邻的隐私仿真数据集进行处理得到两组结果。利用一组结果构建一个累积分布函数(即概率分布函数),作为上述零假设为真时,检验统计量的真实概率分布的近似分布。将另一组结果作为检验统计量,针对上述累积分布函数计算该组结果中每个结果对应的p值(一个样本对应的p值为抽取到该样本或抽取到比该样本更极端情况样本的概率),得到多个p值。发明人发现,根据得到的多个p值,可以构建该多个p值的互补累积分布函数,作为验证隐私保护算法的权衡函数。该权衡函数表示给定显著性水平(最大的第一类错误)情况下,最小的第二类错误与显著性水平之间的对应关系。该权衡函数的图像能够体现出上述隐私保护算法的隐私保护性能。我们可以通过该权衡函数的图像对上述隐私保护算法的隐私保护性能是否满足要求做出决策。具体来说,该权衡函数在直角坐标中的图像与坐标轴围成的面积越大,表示上述隐私保护算法的隐私保护性能越好。
如图1所示,是根据一示例性实施例示出的一种隐私保护算法的验证场景示意图:在图1示出的场景中,首先,获取输入的数据集1、数据集2和待验证的隐私保护算法M。其中,数据集1和数据集2都由隐私仿真数据构成,并且,第一隐私仿真数据集和第二隐私仿真数据集为相邻数据集。接着,调用隐私保护算法M多次处理数据集1,得到一组结果1,调用隐私保护算法M多次处理数据集2,得到一组结果2。利用一组结果1构建一个累积分布函数,并确定一组结果2针对该累积分布函数的多个p值。最后,利用该多个p值构建能够用于验证隐私保护算法M的权衡函数。
下面将结合具体的实施例对本说明书提供的方案进行详细描述。
如图2A所示,图2A是根据一示例性实施例示出的一种隐私保护算法的验证方法的流程图,该方法可以应用于终端设备中,也可以应用于服务器中。该方法可以包括以下步骤:
在步骤201中,获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法。
在本实施例中,首先可以获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法。其中,第一隐私仿真数据集和第二隐私仿真数据集都由隐私仿真数据构成。隐私仿真数据可以是参照需要进行隐私保护的数据而生成的仿真数据,隐私仿真数据可以包括各种类型的数据。例如,隐私仿真数据可以包括但不限于用户的年龄,喜好,定位轨迹,消费记录,银行账户等等。可以理解,本实施例对隐私仿真数据的具体类型方面不限定。
在本实施例中,第一隐私仿真数据集和第二隐私仿真数据集为相邻数据集(若两个数据集具有相同的属性结构,且两个数据集对称差的数量为1,则称这两个数据集为相邻数据集),因此,第一隐私仿真数据集和第二隐私仿真数据集具有相同的属性结构,并且,第一隐私仿真数据集和第二隐私仿真数据集的对称差的数量为1。
在一种实现方式中,可以获取预先基于隐私仿真数据构建的数据集作为第一隐私仿真数据集,并基于该第一隐私仿真数据集,确定第二隐私仿真数据集。在另一种实现方式中,还可以直接获取预先基于隐私仿真数据构建第一隐私仿真数据集,并直接获取预先基于该第一隐私仿真数据集确定的第二隐私仿真数据集。
在本实施例中,待验证的隐私保护算法可以是能够通过对隐私保护数据加入扰动从而提供隐私保护,并完成期望运算的算法(如统计分析运算等)。该隐私保护算法为差分隐私类的随机算法,差分隐私类的随机算法可以包括但不限于ε-差分隐私算法,高斯差分隐私算法等等。可以理解,差分隐私类的随机算法还可以是本领域中已知的以及将来可能出现的任何其他适用的随机算法,本实施例对此方面不限定。
在步骤202中,多次调用上述隐私保护算法处理第一隐私仿真数据集,得到多个第一结果,以及多次调用上述隐私保护算法处理第二隐私仿真数据集,得到多个第二结果。
在本实施例中,可以采用不同的随机数状态,多次调用上述隐私保护算法对第一隐私仿真数据集进行处理,得到多个第一结果。并且,采用不同的随机数状态,多次调用上述隐私保护算法对第二隐私仿真数据集进行处理,得到多个第二结果。其中,随机数状态为隐私保护算法中的参数。需要说明的是,对第一隐私仿真数据集进行处理的过程和对第二隐私仿真数据集进行处理的过程是相互独立的。并且,处理第一隐私仿真数据集的次数和处理第二隐私仿真数据集的次数可以是相同的,也可以是不同的。
在步骤203中,构建多个第一结果的累积分布函数。
在本实施例中,可以将“上述隐私保护算法的隐私保护性能满足要求”作为零假设,将“上述隐私保护算法的隐私保护性能不满足要求”作为备择假设。利用多个第一结果构建累积分布函数,将该累积分布函数作为上述零假设为真时,检验统计量的真实概率分布的近似分布。将多个第二结果作为检验统计量,基于该累积分布函数确定每个第二结果对应的p值。
在本实施例中,可以构建多个第一结果的累积分布函数,具体来说,可以基于多个第一结果以及所选用的函数形式构建多个第一结果的累积分布函数。该累积分布函数可以是任意合理形式的分布函数,例如,该累积分布函数可以是经验分布形式的分布函数,也可以是光滑分布形式的分布函数,本实施例对累积分布函数的具体形式方面不限定。
在步骤204中,确定每个第二结果针对上述累积分布函数的p值,得到多个p值。
在本实施例中,可以将多个第二结果作为检验统计量,基于该累积分布函数确定每个第二结果对应的p值。具体来说,针对任一第二结果,可以将该第二结果作为自变量代入上述累积分布函数中,得到累积分布函数的值,用1减去该累积分布函数的值,所得结果即为该第二结果针对上述累积分布函数的p值。
在步骤205中,构建上述多个p值的互补累积分布函数,作为用于验证上述隐私保护算法的权衡函数。
在本实施例中,该权衡函数为上述多个p值的互补累积分布函数。由于一组随机变量的累积分布函数与该组随机变量的互补累积分布函数之和为1,因此,该权衡函数为1减去上述多个p值的累积分布函数。例如,如果上述多个p值的累积分布函数为F,则f=1-F表示上述多个p值的互补累积分布函数,所以可以将f作为该权衡函数。
在本实施例中,由于上述多个p值的累积分布函数可以是任意合理形式的分布函数,例如,该累积分布函数可以是经验分布形式的累积分布函数,也可以是光滑分布形式的累积分布函数。因此,该权衡函数也可以是任意合理形式的互补累积分布函数,例如,该互补累积分布函数可以是经验生存形式的互补累积分布函数(对应于经验分布形式的累积分布函数),也可以是光滑分布形式的互补累积分布函数(对应于光滑分布形式的累积分布函数)。本实施例对互补累积分布函数的具体形式方面不限定。
在本实施例中,该权衡函数的图像能够表征隐私保护算法的隐私保护性能。具体来说,该权衡函数在直角坐标中的图像与坐标轴围成的面积越大,表示上述隐私保护算法的隐私保护性能越好。如图2B所示,曲线211以及曲线212为不同的权衡函数在直角坐标系中的图像。由图可知,曲线211与坐标轴围成的面积最大,因此,用曲线211所验证的隐私保护算法的保护性能最强。曲线212与坐标轴围成的面积最小,因此,用曲线212所验证的隐私保护算法的保护性能最弱。
在一种实现方式中,可以预先设定面积阈值,得到权衡函数后,可以进一步计算得到的权衡函数在直角坐标中的图像与坐标轴围成的目标面积。若目标面积大于等于预先设定的面积阈值,则做出上述隐私保护算法的隐私保护性能满足要求的决策;若目标面积小于预先设定的面积阈值,则做出上述隐私保护算法的隐私保护性能不满足要求的决策。
在另一种实现方式中,还可以预先设定一个参考函数作为参考标准,将参考函数的图像与得到的权衡函数的图像显示于同一界面的同一坐标系中,以供用户根据参考函数的图像与权衡函数的图像,做出上述隐私保护算法的隐私保护性能是否满足要求的决策。
可以理解,本实施例对利用权衡函数验证隐私保护算法的具体方式方面不限定。
本说明书的上述实施例提供的隐私保护算法的验证方法,通过获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法,多次调用上述隐私保护算法处理第一隐私仿真数据集,得到多个第一结果,以及多次调用上述隐私保护算法处理第二隐私仿真数据集,得到多个第二结果。构建多个第一结果的累积分布函数,确定每个第二结果针对上述累积分布函数的p值,得到多个p值,并利用上述多个p值构建权衡函数,以利用该权衡函数的图像验证上述隐私保护算法的隐私保护性能。从而能够便捷且准确地对隐私保护算法的隐私保护性能做出决策。
在一些可选实施方式中,多个第一结果的累积分布函数为多个第一结果的经验分布函数。
在本实施例中,该累积分布函数可以是经验分布形式的累积分布函数,因此,多个第一结果的累积分布函数可以是多个第一结果的经验分布函数。例如,可以采用如下公式表示多个第一结果的累积分布函数:
Figure BDA0002667234460000111
其中,R表示第一结果的个数,i为大于0,小于等于R的整数,Si表示第i个第一结果,F(t)为该累积分布函数,
Figure BDA0002667234460000112
表示小于等于t的第一结果的个数。
在另一些可选实施方式中,多个第一结果的累积分布函数为多个第一结果的光滑分布函数。
在本实施例中,该累积分布函数可以是光滑分布形式的累积分布函数,因此,多个第一结果的累积分布函数可以是多个第一结果的光滑分布函数。例如,可以采用如下公式表示多个第一结果的累积分布函数:
Figure BDA0002667234460000113
其中,R表示第一结果的个数,i为大于0,小于等于R的整数,Si表示第i个第一结果,h为一个预设常数,K为一个预设函数,F(t)为该累积分布函数。
在另一些可选实施方式中,上述权衡函数为1减多个p值的经验分布函数。
在本实施例中,上述多个p值的累积分布函数可以是经验分布形式的累积分布函数,因此,上述权衡函数为1减去多个p值的经验分布函数。例如,可以采用如下公式表示上述权衡函数:
Figure BDA0002667234460000114
其中,N表示p值的个数(即第二结果的个数),r为大于0,小于等于N的整数,pr表示第r个p值,
Figure BDA0002667234460000121
表示多个p值的经验分布函数,为小于等于α的p值的个数除以N,f(α)为该权衡函数。
在另一些可选实施方式中,上述权衡函数为1减多个p值的光滑分布函数。
在本实施例中,上述多个p值的累积分布函数可以是光滑分布形式的累积分布函数,因此,上述权衡函数为1减多个p值的光滑分布函数。例如,可以采用如下公式表示上述权衡函数:
Figure BDA0002667234460000122
其中,N表示p值的个数(即第二结果的个数),r为大于0,小于等于N的整数,pr表示第r个p值,h为一个预设常数,K为一个预设函数,
Figure BDA0002667234460000123
为多个p值的光滑分布函数,f(α)为该权衡函数。
在另一些可选实施方式中,可以通过如下方式确定第一隐私仿真数据集和第二隐私仿真数据集:
首先,可以获取基于隐私仿真数据构建的第一隐私仿真数据集,并确定该第一隐私仿真数据集的多个相邻数据集。具体来说,可以先基于隐私仿真数据构建第一隐私仿真数据集,然后,生成第一隐私仿真数据集的多个相邻数据集。该多个相邻数据集可以是第一隐私仿真数据集的全部相邻数据集,也可以是第一隐私仿真数据集的部分相邻数据集。
并且,获取待验证的隐私保护算法所对应的非隐私保护的原始算法。具体来说,如果对非隐私保护的算法加入随机扰动,则可以得到该算法所对应的隐私保护算法。因此,待验证的隐私保护算法所对应的非隐私保护的原始算法即为该隐私保护算法加入随机扰动之前的原始算法。
接着,调用该原始算法处理第一隐私仿真数据集,得到第一处理结果,并调用该原始算法处理上述多个相邻数据集中的每个相邻数据集,得到每个相邻数据集对应的第二处理结果。
最后,计算第一处理结果与每个第二处理结果的距离值,选取该距离值最大的第二处理结果所对应的相邻数据集,作为第二隐私仿真数据集。其中,该距离值可以包括以下任意一项:欧式距离值,余弦距离值,曼哈顿距离值,切比雪夫距离值以及汉明距离值。
需要说明的是,上述确定第一隐私仿真数据集和第二隐私仿真数据的方法可以与图2A实施例所示的隐私保护算法的验证方法在相同的设备上执行,也可以在不同的设备上执行,本实施例对此方面不限定。
上述实施例由于选取与第一处理结果的距离值最大的第二处理结果所对应的相邻数据集,作为第二隐私仿真数据集,因此,使得第一隐私仿真数据集和第二隐私仿真数据集对待验证的隐私保护算法具有更高的敏感度。所以,对待验证的隐私保护算法的验证更为严苛,所得到的决策可靠性更高。
如图3所示,图3根据一示例性实施例示出的另一种隐私保护算法的验证方法的流程图,该方法可以应用于终端设备中,也可以应用于服务器中,包括以下步骤:
在步骤301中,获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法。
在步骤302中,多次调用上述隐私保护算法处理第一隐私仿真数据集,得到多个第一结果,以及多次调用上述隐私保护算法处理第二隐私仿真数据集,得到多个第二结果。
在步骤303中,构建多个第一结果的累积分布函数。
在步骤304中,确定每个第二结果针对上述累积分布函数的p值,得到多个p值。
在步骤305中,构建上述多个p值的互补累积分布函数,作为用于验证上述隐私保护算法的权衡函数。
在步骤306中,获取参考函数。
在步骤307中,将该参考函数的图像与上述权衡函数的图像显示于同一界面的同一坐标系中。
在本实施例中,还可以预先设定一个参考函数作为参考标准,将参考函数的图像与得到的权衡函数的图像显示于同一界面的同一坐标系中,以供用户根据参考函数的图像与权衡函数的图像,做出上述隐私保护算法的隐私保护性能是否满足要求的决策。
上述实施例由于将该参考函数的图像与上述权衡函数的图像显示于同一界面的同一坐标系中,因此,能够向用户更直观、准确地展示验证结果。
需要说明的是,对于与图2A实施例中相同的步骤,在上述图3实施例中不再进行赘述,相关内容可参见图2A实施例。
应当注意,尽管在上述实施例中,以特定顺序描述了本说明书实施例的方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。
与前述隐私保护算法的验证方法实施例相对应,本说明书还提供了隐私保护算法的验证装置的实施例。
如图4所示,图4是本说明书根据一示例性实施例示出的一种隐私保护算法的验证装置框图,该装置可以包括:获取模块401,调用模块402,第一构建模块403,确定模块404和第二构建模块405。
其中,获取模块401,用于获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法,该第一隐私仿真数据集和该第二隐私仿真数据集为相邻数据集,该隐私保护算法为差分隐私类的随机算法。
调用模块402,用于多次调用该隐私保护算法处理第一隐私仿真数据集,得到多个第一结果,以及多次调用该隐私保护算法处理第二隐私仿真数据集,得到多个第二结果,其中,每次调用该隐私保护算法采用的随机数状态不同。
第一构建模块403,用于构建上述多个第一结果的累积分布函数。
确定模块404,用于确定每个第二结果针对累积分布函数的p值,得到多个p值,其中,将任一第二结果作为自变量代入累积分布函数所得结果与该第二结果的p值之和为1。
第二构建模块405,用于构建多个p值的互补累积分布函数,作为用于验证该隐私保护算法的权衡函数,该权衡函数的图像表征了该隐私保护算法的隐私保护性能。
在一些可选实施方式中,上述累积分布函数为多个第一结果的经验分布函数。
在另一些可选实施方式中,上述权衡函数为1减上述多个p值的经验分布函数。
在另一些可选实施方式中,第一隐私仿真数据集和第二隐私仿真数据集通过如下方式得到:获取基于隐私仿真数据构建的第一隐私仿真数据集,确定第一隐私仿真数据集的多个相邻数据集,获取上述隐私保护算法所对应的非隐私保护的原始算法,调用该原始算法处理第一隐私仿真数据集,得到第一处理结果,调用该原始算法处理多个相邻数据集中的每个相邻数据集,得到每个相邻数据集对应的第二处理结果,选取与第一处理结果的距离值最大的第二处理结果所对应的相邻数据集,作为第二隐私仿真数据集。
在另一些可选实施方式中,上述距离值可以包括以下任意一项:欧式距离值,余弦距离值,曼哈顿距离值,切比雪夫距离值以及汉明距离值。
如图5所示,图5是本说明书根据一示例性实施例示出的另一种隐私保护算法的验证装置框图,该实施例在前述图4所示实施例的基础上,该装置还可以进一步包括:参考模块406和显示模块407。
其中,参考模块406,用于获取参考函数。
显示模块407,用于将参考函数的图像与权衡函数的图像显示于同一界面的同一坐标系中。
应当理解,上述装置可以预先设置在终端设备或服务器中,也可以通过下载等方式而加载到终端设备或服务器中。上述装置中的相应模块可以与终端设备或服务器中的模块相互配合以实现隐私保护算法的验证方案。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书一个或多个实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本说明书一个或多个实施例还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图2A至图3任一实施例提供的隐私保护算法的验证方法。
对应于上述的隐私保护算法的验证方法,本说明书一个或多个实施例还提出了图6所示的根据本说明书的一示例性实施例的电子设备的示意结构图。请参考图6,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成隐私保护算法的验证装置。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (14)

1.一种隐私保护算法的验证方法,所述方法包括:
获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法;所述第一隐私仿真数据集和所述第二隐私仿真数据集为相邻数据集;所述隐私保护算法为差分隐私类的随机算法;
多次调用所述隐私保护算法处理所述第一隐私仿真数据集,得到多个第一结果,以及多次调用所述隐私保护算法处理所述第二隐私仿真数据集,得到多个第二结果;其中,每次调用所述隐私保护算法采用的随机数状态不同;
构建所述多个第一结果的累积分布函数;
确定每个所述第二结果针对所述累积分布函数的p值,得到多个p值;其中,将任一第二结果作为自变量代入所述累积分布函数所得结果与该第二结果的p值之和为1;
构建所述多个p值的互补累积分布函数,作为用于验证所述隐私保护算法的权衡函数;所述权衡函数的图像表征了所述隐私保护算法的隐私保护性能。
2.根据权利要求1所述的方法,其中,所述累积分布函数为所述多个第一结果的经验分布函数。
3.根据权利要求1所述的方法,其中,所述权衡函数为1减所述多个p值的经验分布函数。
4.根据权利要求1所述的方法,其中,所述第一隐私仿真数据集和所述第二隐私仿真数据集通过如下方式得到:
获取基于隐私仿真数据构建的第一隐私仿真数据集;
确定所述第一隐私仿真数据集的多个相邻数据集;
获取所述隐私保护算法所对应的非隐私保护的原始算法;
调用所述原始算法处理所述第一隐私仿真数据集,得到第一处理结果;
调用所述原始算法处理所述多个相邻数据集中的每个相邻数据集,得到每个相邻数据集对应的第二处理结果;
选取与所述第一处理结果的距离值最大的第二处理结果所对应的相邻数据集,作为第二隐私仿真数据集。
5.根据权利要求4所述的方法,其中,所述距离值包括以下任意一项:
欧式距离值,余弦距离值,曼哈顿距离值,切比雪夫距离值以及汉明距离值。
6.根据权利要求1所述的方法,其中,所述方法还包括:
获取参考函数;
将所述参考函数的图像与所述权衡函数的图像显示于同一界面的同一坐标系中。
7.一种隐私保护算法的验证装置,所述装置包括:
获取模块,用于获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法;所述第一隐私仿真数据集和所述第二隐私仿真数据集为相邻数据集;所述隐私保护算法为差分隐私类的随机算法;
调用模块,用于多次调用所述隐私保护算法处理所述第一隐私仿真数据集,得到多个第一结果,以及多次调用所述隐私保护算法处理所述第二隐私仿真数据集,得到多个第二结果;其中,每次调用所述隐私保护算法采用的随机数状态不同;
第一构建模块,用于构建所述多个第一结果的累积分布函数;
确定模块,用于确定每个所述第二结果针对所述累积分布函数的p值,得到多个p值;其中,将任一第二结果作为自变量代入所述累积分布函数所得结果与该第二结果的p值之和为1;
第二构建模块,用于构建所述多个p值的互补累积分布函数,作为用于验证所述隐私保护算法的权衡函数;所述权衡函数的图像表征了所述隐私保护算法的隐私保护性能。
8.根据权利要求7所述的装置,其中,所述累积分布函数为所述多个第一结果的经验分布函数。
9.根据权利要求7所述的装置,其中,所述权衡函数为1减所述多个p值的经验分布函数。
10.根据权利要求7所述的装置,其中,所述第一隐私仿真数据集和所述第二隐私仿真数据集通过如下方式得到:
获取基于隐私仿真数据构建的第一隐私仿真数据集;
确定所述第一隐私仿真数据集的多个相邻数据集;
获取所述隐私保护算法所对应的非隐私保护的原始算法;
调用所述原始算法处理所述第一隐私仿真数据集,得到第一处理结果;
调用所述原始算法处理所述多个相邻数据集中的每个相邻数据集,得到每个相邻数据集对应的第二处理结果;
选取与所述第一处理结果的距离值最大的第二处理结果所对应的相邻数据集,作为第二隐私仿真数据集。
11.根据权利要求10所述的装置,其中,所述距离值包括以下任意一项:
欧式距离值,余弦距离值,曼哈顿距离值,切比雪夫距离值以及汉明距离值。
12.根据权利要求7所述的装置,其中,所述装置还包括:
参考模块,用于获取参考函数;
显示模块,用于将所述参考函数的图像与所述权衡函数的图像显示于同一界面的同一坐标系中。
13.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-6中任一项所述的方法。
14.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1-6中任一项所述的方法。
CN202010922588.1A 2020-09-04 2020-09-04 隐私保护算法的验证方法、装置及电子设备 Active CN112016123B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010922588.1A CN112016123B (zh) 2020-09-04 2020-09-04 隐私保护算法的验证方法、装置及电子设备
CN202111234174.0A CN113886886A (zh) 2020-09-04 2020-09-04 隐私保护算法的验证方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010922588.1A CN112016123B (zh) 2020-09-04 2020-09-04 隐私保护算法的验证方法、装置及电子设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202111234174.0A Division CN113886886A (zh) 2020-09-04 2020-09-04 隐私保护算法的验证方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN112016123A true CN112016123A (zh) 2020-12-01
CN112016123B CN112016123B (zh) 2021-09-07

Family

ID=73515565

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202111234174.0A Pending CN113886886A (zh) 2020-09-04 2020-09-04 隐私保护算法的验证方法、装置及电子设备
CN202010922588.1A Active CN112016123B (zh) 2020-09-04 2020-09-04 隐私保护算法的验证方法、装置及电子设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202111234174.0A Pending CN113886886A (zh) 2020-09-04 2020-09-04 隐私保护算法的验证方法、装置及电子设备

Country Status (1)

Country Link
CN (2) CN113886886A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729621A (zh) * 2017-09-20 2018-02-23 北京安怀信科技股份有限公司 一种静力学模型的验证工具
CN109508559A (zh) * 2018-11-02 2019-03-22 西安交通大学 群智感知系统中基于连接函数的多维数据本地隐私保护方法
CN110334548A (zh) * 2019-07-16 2019-10-15 桂林电子科技大学 一种基于差分隐私的数据异常检测方法
CN110968893A (zh) * 2019-11-21 2020-04-07 中山大学 一种基于Pufferfish框架的针对关联分类数据序列的隐私保护方法
CN111313998A (zh) * 2020-02-18 2020-06-19 北京邮电大学 一种统计信道模型验证方法及装置
CN111475838A (zh) * 2020-04-02 2020-07-31 中国人民解放军国防科技大学 基于深度神经网络的图数据匿名方法、装置、存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9672364B2 (en) * 2013-03-15 2017-06-06 Microsoft Technology Licensing, Llc Differentially private linear queries on histograms
JP6584861B2 (ja) * 2015-08-19 2019-10-02 Kddi株式会社 プライバシ保護装置、方法及びプログラム
EP3839790A4 (en) * 2018-08-17 2022-04-27 The Fourth Paradigm (Beijing) Tech Co Ltd METHOD AND SYSTEM FOR PERFORMING MACHINE LEARNING UNDER DATA PRIVACY PROTECTION
US11101979B2 (en) * 2019-05-30 2021-08-24 Kira Inc. Method and system for creating word-level differential privacy using feature hashing techniques
CN111342962B (zh) * 2020-04-01 2020-10-30 支付宝(杭州)信息技术有限公司 一种验证密文消息范围的方法和系统
CN111506924B (zh) * 2020-06-08 2023-10-13 Oppo广东移动通信有限公司 一种差分隐私保护方法、装置及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729621A (zh) * 2017-09-20 2018-02-23 北京安怀信科技股份有限公司 一种静力学模型的验证工具
CN109508559A (zh) * 2018-11-02 2019-03-22 西安交通大学 群智感知系统中基于连接函数的多维数据本地隐私保护方法
CN110334548A (zh) * 2019-07-16 2019-10-15 桂林电子科技大学 一种基于差分隐私的数据异常检测方法
CN110968893A (zh) * 2019-11-21 2020-04-07 中山大学 一种基于Pufferfish框架的针对关联分类数据序列的隐私保护方法
CN111313998A (zh) * 2020-02-18 2020-06-19 北京邮电大学 一种统计信道模型验证方法及装置
CN111475838A (zh) * 2020-04-02 2020-07-31 中国人民解放军国防科技大学 基于深度神经网络的图数据匿名方法、装置、存储介质

Also Published As

Publication number Publication date
CN113886886A (zh) 2022-01-04
CN112016123B (zh) 2021-09-07

Similar Documents

Publication Publication Date Title
CN109347787B (zh) 一种身份信息的识别方法及装置
US10832032B2 (en) Facial recognition method, facial recognition system, and non-transitory recording medium
TW202123043A (zh) 對抗攻擊的監測方法和裝置
CN111445007A (zh) 对抗生成神经网络的训练方法及系统
CN111027412B (zh) 一种人体关键点识别方法、装置及电子设备
CN111523143B (zh) 针对多方的隐私数据进行聚类的方法和装置
CN111292377B (zh) 目标检测方法、装置、计算机设备和存储介质
CN110059068B (zh) 一种分布式存储系统中的数据校验方法及数据校验系统
CN111611390B (zh) 一种数据处理方法及装置
CN113065593A (zh) 模型训练方法、装置、计算机设备和存储介质
CN110309154B (zh) 基于图谱的实体特征选择方法、装置、设备和存储介质
CN114022926A (zh) 一种人脸识别方法、装置、设备以及存储介质
CN112016123B (zh) 隐私保护算法的验证方法、装置及电子设备
CN117237678A (zh) 用电行为异常检测方法、装置、设备及存储介质
CN110874638B (zh) 面向行为分析的元知识联邦方法、装置、电子设备及系统
CN117034273A (zh) 基于图卷积网络的安卓恶意软件检测方法及系统
CN115081122B (zh) 板壳结构几何中面的自动抽取方法、设备及介质
CN113627950B (zh) 基于动态图的用户交易特征提取的方法和系统
CN112528500B (zh) 一种场景图构造模型的评估方法及评估设备
CN115174237A (zh) 一种物联网系统恶意流量的检测方法、装置和电子设备
CN109064393B (zh) 人脸特效处理方法及装置
CN111709955A (zh) 图像分割检验方法、装置、终端及存储介质
CN116094952B (zh) 网络结构相似度的确定方法、装置、设备以及存储介质
CN114003305B (zh) 设备相似度计算方法、计算机设备和存储介质
CN113792185B (zh) 估计缺失信号方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40042418

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant