CN114036571A

CN114036571A - 一种基于隐私保护的数据处理方法、装置及设备

Info

Publication number: CN114036571A
Application number: CN202111425766.0A
Authority: CN
Inventors: 吴若凡
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-11-26
Filing date: 2021-11-26
Publication date: 2022-02-11

Abstract

本说明书实施例公开了一种基于隐私保护的数据处理方法、装置及设备，该方法包括：获取待处理的目标数据，所述目标数据包括连续型结构化数据和/或图像类数据，然后，可以通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

Description

一种基于隐私保护的数据处理方法、装置及设备

技术领域

本文件涉及计算机技术领域，尤其涉及一种基于隐私保护的数据处理方法、装置及设备。

背景技术

深度学习往往能通过复杂的大型架构和庞大的数据规模获得出众性能的模型，其中需要使用的训练样本往往需要标注以得到每个训练样本的标签数据，由于训练样本的标签数据在实际应用中往往要求高昂的标注成本，使得无监督学习或半监督学习成为这类情况下重要的技术工具。但是，在无监督学习或半监督学习中，大量无标注的训练样本在易于获取的同时也增加了隐私风险，例如，无监督学习中，在训练模型的过程中可能会允许攻击方通过查询模型(Query the Model)的方式提取原始的训练样本，从而使得个人隐私数据被窃取，在数据合规越发严格的当下，无监督学习或半监督学习中的隐私保护越来越受关注。对比学习(Contrastive Learning)是目前较为常用的预训练范式，也是较为典型的自监督技巧，对比学习可以通过最大化两个相同底层对象的不同数据增强(Augmentation)处理来实现自监督学习。为此，需要提供一种在对比学习中进行隐私保护处理，以实现预训练的同时不泄露用户隐私的技术方案。

发明内容

本说明书实施例的目的是提供一种在对比学习中进行隐私保护处理，以实现预训练的同时不泄露用户隐私的技术方案。

为了实现上述技术方案，本说明书实施例是这样实现的：

本说明书实施例提供的一种基于隐私保护的数据处理方法，所述方法包括：获取待处理的目标数据，所述目标数据包括连续型结构化数据和/或图像类数据。通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

本说明书实施例提供的一种基于隐私保护的数据处理方法，应用于区块链系统，所述方法包括：获取基于隐私保护的对比学习的规则信息，采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并将所述第一智能合约部署到所述区块链系统中。当获取到待处理的目标数据时，调用所述第一智能合约，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，所述目标数据包括连续型结构化数据和/或图像类数据。调用所述第一智能合约，并基于多种不同的隐私预算对应的差分隐私结果，通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

本说明书实施例提供的一种基于隐私保护的数据处理装置，所述装置包括：数据获取模块，获取待处理的目标数据，所述目标数据包括连续型结构化数据和/或图像类数据。差分隐私模块，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。对比学习模块，基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

本说明书实施例提供的一种基于隐私保护的数据处理装置，所述装置为区块链系统中的装置，所述装置包括：合约部署模块，获取基于隐私保护的对比学习的规则信息，采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并将所述第一智能合约部署到所述区块链系统中。差分隐私模块，当获取到待处理的目标数据时，调用所述第一智能合约，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，所述目标数据包括连续型结构化数据和/或图像类数据。对比学习模块，调用所述第一智能合约，并基于多种不同的隐私预算对应的差分隐私结果，通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

本说明书实施例提供的一种基于隐私保护的数据处理设备，包括：处理器；以及被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器：获取待处理的目标数据，所述目标数据包括连续型结构化数据和/或图像类数据。通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

本说明书实施例提供的一种基于隐私保护的数据处理设备，所述设备为区块链系统中的设备，所述基于隐私保护的数据处理设备包括：处理器；以及被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器：获取基于隐私保护的对比学习的规则信息，采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并将所述第一智能合约部署到所述区块链系统中。当获取到待处理的目标数据时，调用所述第一智能合约，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，所述目标数据包括连续型结构化数据和/或图像类数据。调用所述第一智能合约，并基于多种不同的隐私预算对应的差分隐私结果，通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

本说明书实施例还提供了一种存储介质，其中，所述存储介质用于存储计算机可执行指令，所述可执行指令在被执行时实现以下流程：获取待处理的目标数据，所述目标数据包括连续型结构化数据和/或图像类数据。通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

本说明书实施例还提供了一种存储介质，其中，所述存储介质用于存储计算机可执行指令，所述可执行指令在被执行时实现以下流程：获取基于隐私保护的对比学习的规则信息，采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并将所述第一智能合约部署到区块链系统中。当获取到待处理的目标数据时，调用所述第一智能合约，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，所述目标数据包括连续型结构化数据和/或图像类数据。调用所述第一智能合约，并基于多种不同的隐私预算对应的差分隐私结果，通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书一种基于隐私保护的数据处理方法实施例；

图2为本说明书一种基于隐私保护的数据处理相关界面的结构示意图；

图3为本说明书另一种基于隐私保护的数据处理方法实施例；

图4为本说明书又一种基于隐私保护的数据处理方法实施例；

图5A为本说明书又一种基于隐私保护的数据处理方法实施例；

图5B为本说明书一种基于隐私保护的数据处理过程示意图；

图6为本说明书一种基于隐私保护的数据处理装置实施例；

图7为本说明书另一种基于隐私保护的数据处理装置实施例；

图8为本说明书一种基于隐私保护的数据处理设备实施例。

具体实施方式

本说明书实施例提供一种基于隐私保护的数据处理方法、装置及设备。

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

实施例一

如图1所示，本说明书实施例提供一种基于隐私保护的数据处理方法，该方法的执行主体可以为终端设备或服务器，其中，该终端设备可以如手机、平板电脑等移动终端设备，也可以是个人计算机等设备，该服务器可以是独立的一个服务器，还可以是由多个服务器构成的服务器集群等，该服务器可以是如金融业务或网络购物业务等的后台服务器，也可以是某应用程序的后台服务器等。该方法可以应用于设置有通过对比学习进行模型训练等的相关场景中，本实施例中以服务器为执行主体进行详细说明，对于终端设备的情况，可以参见下述相关内容，在此不再赘述。该方法具体可以包括以下步骤：

在步骤S102中，获取待处理的目标数据，该目标数据包括连续型结构化数据和/或图像类数据。

其中，目标数据可以是某些场景(如某区域内涉及金融领域的相关场景或跨区域的数据交互、验证、风险防控等场景)下的任意数据，在实际应用中，目标数据中可以包括上述场景下的敏感数据或隐私数据，且目标数据的内容中包括连续型结构化数据和/或图像类数据，其中的连续型结构化数据可以是数据连续的结构化数据(即其数据不是单独或孤立的某个数值或数字，而是由包含若干位小数且取值密集的结构化数据)，也可以称作连续型的行数据，可以是由二维表结构来逻辑表达和实现的数据，其严格地遵循数据格式与长度规范的数据，图像类数据可以包括图像和/或视频等。需要说明的是，本实施例中的连续型结构化数据和图像类数据需要满足对于每个数据的维度，其数据的取值范围是有界的，例如，对于图像类数据，其每个像素点的取值范围可以为0-255等，具体可以根据实际情况设定，本说明书实施例对此不做限定。

在实施中，深度学习往往能通过复杂的大型架构和庞大的数据规模获得出众性能的模型，其中需要使用的训练样本往往需要标注以得到每个训练样本的标签数据，由于训练样本的标签数据在实际应用中往往要求高昂的标注成本，使得无监督学习或半监督学习成为这类情况下重要的技术工具。但是，在无监督学习或半监督学习中，大量无标注的训练样本在易于获取的同时也增加了隐私风险，例如，无监督学习中，在训练模型的过程中可能会允许攻击方通过查询模型(Query the Model)的方式提取原始的训练样本，从而使得个人隐私数据被窃取，在数据合规越发严格的当下，无监督学习或半监督学习中的隐私保护越来越受关注。对比学习(Contrastive Learning)是目前较为常用的预训练范式，也是较为典型的自监督技巧，对比学习可以通过最大化两个相同底层对象的不同数据增强(Augmentation)处理来实现自监督学习。为此，需要提供一种在对比学习中进行隐私保护处理，以实现预训练的同时不泄露用户隐私的技术方案。本说明书实施例提供一种可实现的技术方案，具体可以包括以下内容：

可以通过多种不同的方式获取待处理的目标数据，例如，可以预先设置有目标数据的输入页面，该输入页面中可以包括目标数据的数据输入框、确定按键和取消按键等，当需要向服务器上传某数据(即目标数据)时，可以获取上述输入页面的数据，并可以显示该输入页面。如图2所示，用户可以在该数据页面的数据输入框中输入目标数据，输入完成后，可以点击该输入页面中的确定按键，此时，服务器可以获取目标数据，并可以将目标数据作为待处理的目标数据。或者，服务器中可以记录某服务的相关数据，当需要获取目标数据时，可以从上述给服务的相关数据中获取满足指定需求的数据，将获取的数据作为目标数据等，除了可以通过上述方式获取目标数据外，还可以通过多种不同的方式获取目标数据，具体可以根据实际情况设定，本说明书实施例对此不做限定。

在步骤S104中，通过预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

其中，隐私预算作为差分隐私保护机制中的核心参数，既决定了差分隐私的保护水平，又决定了隐私泄露的程度，在差分隐私保护机制中可以不统一使用隐私预算，而是可以将隐私预算进行多次分配，例如，可以将隐私预算分成3个部分，如子隐私预算1、子隐私预算2和子隐私预算3，其中，子隐私预算1+子隐私预算2+子隐私预算3＝隐私预算，3个部分的数值大小可以根据实际情况设定。可以为每次的差分隐私处理设置一个隐私预算，这样，可以预先设定多种不同的隐私预算，例如，可以设定2种隐私预算，或者，预先设定3种隐私预算等，具体可以根据实际情况设定。差分隐私旨在当被采集数据的用户并不信任数据采集方，虽然该用户仍然会将相应的数据上传给数据采集方，但该用户会希望在一定程度上述保护上述采集的数据。差分隐私可以在当从统计数据库查询时，最大化数据查询的准确性，同时最大限度减少识别其记录的几率。差分隐私是通过对数据进行扰动达到保护隐私的目的，其中的扰动机制可以包括多种，如拉普拉斯Laplace机制、指数机制等。差分隐私可以包括中心化差分隐私和本地化差分隐私(Local Differential Privacy，LDP)，其中的本地化差分隐私是在待上传数据被收集前，由用户在本地先对待上传数据进行扰动，然后将加噪后的待上传数据上传到服务器(或服务中心)，本地化差分隐私可以包括以下定义：算法A是∈满足的本地化差分隐私(∈-LDP)，其中∈≥0，当且仅当对于任意两个数据v和v’，均满足如下公式：

其中，v和v’属于A的定义域，y属于A的值域。从用户角度来看，本地化差分隐私能更好地保护用户数据的隐私，用户数据在被采集前，已经在本地进行扰动处理，用户数据中的隐私内容已被抹去。

在实施中，为了避免对比学习中待处理的目标数据中包含的隐私数据被泄露，可以对目标数据进行差分隐私处理，从而使得目标数据中的隐私数据被扰乱，即使上述目标数据被泄露，该目标数据中的隐私数据也无法被识别，造成目标数据中的隐私数据被其他人所知晓，保护了用户的隐私。其中，差分隐私可以包括多种可实现方式，以下提供一种可选的实现方式，具体可以包括以下内容：通过指数机制的差分隐私算法，基于预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。具体地，对于指数机制的差分隐私算法，以及预设的多种不同的隐私预算中的任一种隐私预算，设查询函数的输出域为R，输出域中的每个输出值r∈R，函数q(D，r)→R成为输出值r的可用性函数，用于评估输出值r的优劣程度。若设随机算法M的输入为数据集D，输出为对象r∈R，函数q(D，r)→R为可用性函数，Δq为函数q(D，r)→R的敏感度，若算法M以正比于exp(∈q(D，r)/2Δq)的概率从R中选择并输出r，则算法M提供∈-差分隐私保护。基于上述方式，对于算法M的输入为目标数据，目标数据对应的输出值r∈R，算法M以正比于exp(∈q(目标数据，r)/2Δq)的概率从R中选择并输出r，从而得到该隐私预算对应的差分隐私结果。通过上述方式，可以得到其它隐私预算对应的差分隐私结果，进而可以得到每种隐私预算对应的差分隐私结果。

需要说明的是，上述处理过程仅是差分隐私的一种可实现的方式，在实际应用中，除了可以通过上述方式处理外，还可以通过多种方式对目标数据进行差分隐私处理，具体可以根据实际情况设定，本说明书实施例对此不做限定。此外，上述仅是对目标数据进行差分隐私处理，在实际应用中，还可以对目标数据中的隐私数据进行差分隐私处理，即可以分别对目标数据和目标数据中的隐私数据进行差分隐私处理，得到处理后的数据，具体可以根据实际情况设定，本说明书实施例对此不做限定。

在步骤S106中，基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

其中，对比损失算法可以是对比学习中采用的常用的损失算法，例如InfoNCE算法或MoCo算法等，具体可以根据实际情况设定，本说明书实施例对此不做限定。目标模型可以是任意模型，例如分类模型、神经网络模型等，具体可以根据实际情况设定，本说明书实施例对此不做限定。

在实施中，可以根据实际情况基于预设的算法构建目标模型的初始架构，可以将多种不同的隐私预算对应的差分隐私结果输入到目标模型的初始架构中，得到相应的结果，然后，可以使用预设的对比学习损失算法计算该结果对应的损失值，基于得到的损失值对目标模型中的待定参数的参数值进行调整，之后，可以得到调整后的目标模型。可以基于上述方式可以得到更多的不同的隐私预算对应的差分隐私结果，可以将该差分隐私结果输入到调整后的目标模型中，得到相应的结果，然后，可以使用预设的对比学习损失算法计算该结果对应的损失值，基于得到的损失值对调整后的目标模型中的待定参数的参数值进行调整，最终可以得到训练后的目标模型。可以将训练后的模型部署到相应的应用场景中。

本说明书实施例提供一种基于隐私保护的数据处理方法，获取待处理的目标数据，目标数据包括连续型结构化数据和/或图像类数据，然后，可以通过预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型，这样，通过构造隐私保护的数据来实现隐私保护的自监督对比学习，达到了预训练的同时不泄露用户隐私的目的，此外，本技术方案适用于图像类数据和其他连续型结构化数据，应用范围较广，而且本技术方案提供了可控的隐私保护机制，该隐私保护机制同时也能用于控制对比学习中正样本的相似程度等。

实施例二

如图3所示，本说明书实施例提供一种基于隐私保护的数据处理方法，该方法的执行主体可以为终端设备或服务器，其中，该终端设备可以如手机、平板电脑等移动终端设备，也可以是个人计算机等设备，该服务器可以是独立的一个服务器，还可以是由多个服务器构成的服务器集群等，该服务器可以是如金融业务或网络购物业务等的后台服务器，也可以是某应用程序的后台服务器等。该方法可以应用于设置有通过对比学习进行模型训练等的相关场景中，本实施例中以服务器为执行主体进行详细说明，对于终端设备的情况，可以参见下述相关内容，在此不再赘述。该方法具体可以包括以下步骤：

在步骤S302中，获取待处理的目标数据，目标数据包括连续型结构化数据和/或图像类数据。

在步骤S304中，通过预设的多种不同的隐私预算，采用预设的差分隐私算法分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，该差分隐私算法包括基于拉普拉斯机制的差分隐私算法、基于指数机制的差分隐私算法和基于高斯机制的差分隐私算法中的一种或多种。

其中，隐私预算基于目标数据对应的向量的维度信息和对目标数据的隐私保护的目标确定，通常，在满足差分隐私的前提下，隐私预算取值可以不超过20，如果差分隐私对应的隐私保护的强度相对较低(如差分隐私对应的隐私保护协议为重构攻击保护协议(Protection Against Reconstruction)等)，则隐私预算取值的最大值可以为sqrt(d)，其中d为目标数据包含的维度的数量。

在实施中，可以根据实际情况预先设定隐私预算的数量，例如设定2种隐私预算，针对第1种隐私预算，可以采用某一种差分隐私算法(例如基于拉普拉斯机制的差分隐私算法、基于指数机制的差分隐私算法或基于高斯机制的差分隐私算法等)对目标数据进行差分隐私处理，得到第1种隐私预算对应的差分隐私结果。针对第2种隐私预算，可以采用某一种差分隐私算法(例如基于拉普拉斯机制的差分隐私算法、基于指数机制的差分隐私算法或基于高斯机制的差分隐私算法等)对目标数据进行差分隐私处理，得到第2种隐私预算对应的差分隐私结果。通过上述方式，可以将同一个目标数据分别进行了2次不同隐私预算的差分隐私处理，得到相应的2种差分隐私结果。

如果预先设定3种隐私预算，则可以通过上述方式分别对同一个目标数据进行差分隐私处理，得到相应的差分隐私结果，即3种隐私预算中每种隐私预算对应的差分隐私结果，相应的，如果预先设定超过3种隐私预算，则可以通过上述方式得到每种隐私预算对应的差分隐私结果。

其中，对于采用基于拉普拉斯机制的差分隐私算法对目标数据进行差分隐私处理、采用基于指数机制的差分隐私算法对目标数据进行差分隐私处理，以及采用基于高斯机制的差分隐私算法对目标数据进行差分隐私处理等具体处理过程，可以根据不同的差分隐私算法所确定的算法步骤进行处理，本说明书实施例在此不再赘述。

上述步骤S304的具体处理方式可以多种多样，以下提供一种可选的处理方式，具体可以包括以下步骤A2～步骤A6的处理。

在步骤A2中，获取目标数据对应的向量的维度的数量。

在实施中，可以预先设定向量化处理机制，向量化处理机制可以包括多种，例如可以是基于数据特征的向量化处理机制或基于数据片段与向量的对应关系的向量化处理机制(具体如，针对某数据，可以从该数据中选取关键数据片段，并可以从预先构建的对应关系中获取关键数据片段对应的向量，然后，可以对选取的关键数据片段对应的向量进行融合处理，得到该数据对应的向量等)等，具体可以根据实际情况设定，本说明书实施例对此不做限定。可以通过该向量化处理机制对目标数据进行向量化处理，得到目标数据对应的向量，得到的向量可以包括多个维度，此时，可以获取目标数据对应的向量包含的维度的数量，如256维或128维等，具体可以根据实际情况确定。

在步骤A4中，基于预设的多种不同的隐私预算和上述维度的数量，确定每个维度对应的隐私预算。

在实施中，对于任意一种隐私预算，由于目标数据包括多个维度的数据，因此，可以将该隐私预算分摊到目标数据的每个维度上，基于此，可以基于上述维度的数量将该隐私预算分成多个部分，例如，上述维度的数量为128维，则可以将该隐私预算分成128个子隐私预算，将某隐私预算分成多个子隐私预算的过程可以通过多种不同的方式实现，例如，可以随机将该隐私预算分成多个子隐私预算，或者，可以平均分配该隐私预算，得到多个相同的子隐私预算等，具体可以根据实际情况设定，本说明书实施例对此不做限定。通过上述方式，可以对其它隐私预算进行上述处理，最终，可以得到针对多种不同的隐私预算中每一种隐私预算，每个维度对应的隐私预算。

在步骤A6中，采用预设的差分隐私算法和每个维度对应的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

在实施中，针对任意一种隐私预算，通过上述方式可以得到每个维度对应的隐私预算，然后，可以采用预设的差分隐私算法对目标数据进行差分隐私处理，得到该隐私预算对应的差分隐私结果，通过上述方式，可以得到多种不同的隐私预算中每种隐私预算对应的差分隐私结果。

在步骤S306中，基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

在实施中，在对目标模型进行训练的过程中，通过预设的对比学习损失算法进行对比损失计算时，可以采用通过下述方式计算：有一个随机生成的数据批(data batch)，批尺寸为B，通过以上差分隐私处理和/或数据增强处理后，可以生成2B个经过隐私保护的数据，然后，可以对上述数据批的数据对使用诸如InfoNCE或MoCo等对比学习损失算法来计算得到相应的损失值(即对比损失数值)。可以基于该损失值对目标模型中的相应参数进行调整，重复上述处理，直到得到最终训练后的目标模型。

实施例三

如图4所示，本说明书实施例提供一种基于隐私保护的数据处理方法，该方法的执行主体可以为终端设备或服务器，其中，该终端设备可以如手机、平板电脑等移动终端设备，也可以是个人计算机等设备，该服务器可以是独立的一个服务器，还可以是由多个服务器构成的服务器集群等，该服务器可以是如金融业务或网络购物业务等的后台服务器，也可以是某应用程序的后台服务器等。该方法可以应用于设置有通过对比学习进行模型训练等的相关场景中，本实施例中以服务器为执行主体进行详细说明，对于终端设备的情况，可以参见下述相关内容，在此不再赘述。该方法具体可以包括以下步骤：

在步骤S402中，获取待处理的目标数据，目标数据包括图像类数据。

在步骤S404中，根据预设的隐私预算的数量，分别对目标数据进行数据增强处理，得到多个增强数据。

其中，隐私预算基于目标数据对应的向量的维度信息和对目标数据的隐私保护的目标确定。数据增强处理可以是对现有数据进行增加以得到更多的数据，数据增强处理可以通过多种方式实现，例如，可以通过对图像进行水平方向和/或垂直方向的翻转的方式、通过对图像进行旋转的方式、通过对图像进行向内或向外缩放的方式、通过对图像进行裁剪的方式、通过对图像进行移位的方式、通过向图像中添加高斯噪声的方式等，具体可以根据实际情况设定，本说明书实施例对此不做限定。

在实施中，预设的隐私预算的数量可以为2，则可以对目标数据进行两次数据增强处理，即每种隐私预算进行一次数据增强处理，具体地，针对第1种隐私预算，可以通过上述任意一种方式(如通过对图像进行水平方向和/或垂直方向的翻转的方式、通过对图像进行旋转的方式、通过对图像进行向内或向外缩放的方式、通过对图像进行裁剪的方式、通过对图像进行移位的方式或通过向图像中添加高斯噪声的方式)对目标数据进行数据增强处理，得到相应的增强数据，同样的，针对第2种隐私预算，可以通过上述任意一种方式(如通过对图像进行水平方向和/或垂直方向的翻转的方式、通过对图像进行旋转的方式、通过对图像进行向内或向外缩放的方式、通过对图像进行裁剪的方式、通过对图像进行移位的方式或通过向图像中添加高斯噪声的方式)对目标数据进行数据增强处理，得到相应的增强数据，从而可以得到2种不同的隐私预算对应的2个增强数据。

上述步骤S404的具体处理方式可以多种多样，以下提供一种可选的处理方式，具体可以包括以下步骤B2和步骤B4的处理。

在步骤B2中，根据上述隐私预算的数量，确定对目标数据进行数据增强处理所需采用的处理方式。

其中，确定的处理方式为预设的一种处理方式，或，确定的处理方式包括多种不同的处理方式，确定的处理方式可以是上述多种方式中的一种或多种，本实施例中，确定的处理方式可以包括随机旋转(即通过对图像进行旋转的方式)和图像裁剪(即通过对图像进行裁剪的方式)中的一种或多种。

在步骤B4中，根据上述隐私预算的数量，通过确定的处理方式分别对目标数据进行数据增强处理，得到多个增强数据。

在实施中，如果上述隐私预算的数量为2，则第1种隐私预算对应的确定的处理方式可以为随机旋转，第2种隐私预算对应的确定的处理方式可以为随机旋转，则可以对上述2种隐私预算分别通过随机旋转的方式对目标数据进行数据增强处理，得到2个增强数据，或者，第1种隐私预算对应的确定的处理方式可以为随机旋转，第2种隐私预算对应的确定的处理方式可以为图像裁剪，则可以对上述第1种隐私预算通过随机旋转的方式对目标数据进行数据增强处理，得到相应的增强数据，可以对上述第2种隐私预算通过图像裁剪的方式对目标数据进行数据增强处理，得到相应的增强数据。

在步骤S406中，通过预设的多种不同的隐私预算，对上述增强数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

上述步骤S406的具体处理方式可以多种多样，以下提供一种可选的处理方式，具体可以包括以下内容：通过预设的多种不同的隐私预算，采用预设的差分隐私算法分别对上述增强数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，该差分隐私算法包括基于拉普拉斯机制的差分隐私算法、基于指数机制的差分隐私算法和基于高斯机制的差分隐私算法中的一种或多种。

上述内容的具体处理方式可以多种多样，以下提供一种可选的处理方式，具体可以包括以下步骤C2～步骤C6的处理。

在步骤C2中，获取上述增强数据对应的向量的维度的数量。

在步骤C4中，基于预设的多种不同的隐私预算和上述维度的数量，确定每个维度对应的隐私预算。

在步骤C6中，采用预设的差分隐私算法和每个维度对应的隐私预算，分别对上述增强数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

上述各步骤的具体处理过程可以参见上述相关内容，在此不再赘述。

在步骤S408中，基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

在实施中，在对目标模型进行训练的过程中，通过预设的对比学习损失算法进行对比损失计算时，可以采用通过下述方式计算：有一个随机生成的数据批，批尺寸为B，通过以上数据增强处理后，可以生成2B个经过隐私保护的数据，然后，可以对上述数据批的数据对使用诸如InfoNCE或MoCo等对比学习损失算法来计算得到相应的损失值(即对比损失数值)。可以基于该损失值对目标模型中的相应参数进行调整，重复上述处理，直到得到最终训练后的目标模型。

实施例四

如图5A和图5B所示，本说明书实施例提供一种基于隐私保护的数据处理方法，该方法的执行主体可以为区块链系统，该区块链系统可以由终端设备和/或服务器等组成，其中，该终端设备可以如手机、平板电脑等移动终端设备，也可以是个人计算机等设备，该服务器可以是独立的一个服务器，还可以是由多个服务器构成的服务器集群等，该服务器可以是如金融业务或网络购物业务等的后台服务器，也可以是某应用程序的后台服务器等。该方法可以应用于设置有通过对比学习进行模型训练等的相关场景中，该方法具体可以包括以下步骤：

在步骤S502中，获取基于隐私保护的对比学习的规则信息，采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并将所述第一智能合约部署到所述区块链系统中。

其中，智能合约可以是一种旨在以信息化方式传播、验证或执行合同的计算机协议，智能合约允许在没有第三方的情况下进行可信交互，进行的上述交互过程可追踪且不可逆转，智能合约中包括合约参与方可以在上面执行合约参与方同意的权利和义务的协议。

在实施中，为了使得基于隐私保护的对比学习过程的可追溯性更好，可以创建或加入指定的区块链系统，这样，可以基于区块链系统执行基于隐私保护的对比学习，具体地，区块链节点中可以安装有相应的应用程序，该应用程序中可以设置有基于隐私保护的对比学习的规则信息的输入框和/或选择框等，可以在上述输入框和/或选择框中设置相应的信息。然后，区块链系统可以接收基于隐私保护的对比学习的规则信息。区块链系统可以通过基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并可以向该区块链系统中部署第一智能合约，这样，区块链系统中存储了基于隐私保护的对比学习的规则信息和相应的第一智能合约，其他用户无法篡改基于隐私保护的对比学习的规则信息和相应的第一智能合约，而且，区块链系统通过第一智能合约执行基于隐私保护的对比学习。

在步骤S504中，当获取到待处理的目标数据时，调用第一智能合约，通过预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，目标数据包括连续型结构化数据和/或图像类数据。

其中，隐私预算基于目标数据对应的向量的维度信息和对目标数据的隐私保护的目标确定。

在实施中，第一智能合约中可以设置有通过预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理的相关规则信息，这样，基于第一智能合约中的上述规则信息可以实现上述相应的处理，具体可以参见上述相关内容，在此不再赘述。

如果目标数据包括图像类数据，则上述步骤S504中调用所述第一智能合约，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果之前，还可以包括以下处理：基于预先部署于区块链系统中的第二智能合约，根据上述隐私预算的数量，分别对目标数据进行数据增强处理，得到多个增强数据。

在实施中，第二智能合约中可以设置有根据上述隐私预算的数量，分别对目标数据进行数据增强处理的相关规则信息，这样，基于第二智能合约中的上述规则信息可以实现上述相应的处理，具体可以参见上述相关内容，在此不再赘述。

上述对目标数据进行数据增强处理的处理方式可以多种多样，以下提供一种可选的处理方式，具体可以包括以下：基于第二智能合约，根据上述隐私预算的数量，确定对目标数据进行数据增强处理所需采用的处理方式；基于第二智能合约，根据上述隐私预算的数量，通过确定的处理方式分别对目标数据进行数据增强处理，得到多个增强数据。

其中，确定的处理方式为预设的一种处理方式，或，确定的处理方式包括多种不同的处理方式，确定的处理方式包括随机旋转和图像裁剪中的一种或多种。

在实施中，第二智能合约中可以设置有根据上述隐私预算的数量，确定对目标数据进行数据增强处理所需采用的处理方式，以及根据上述隐私预算的数量，通过确定的处理方式分别对目标数据进行数据增强处理的相关规则信息，这样，基于第二智能合约中的上述规则信息可以实现上述相应的处理，具体可以参见上述相关内容，在此不再赘述。

基于上述处理，上述步骤S504中调用第一智能合约，通过预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果的处理可以包括：调用第一智能合约，通过预设的多种不同的隐私预算，对上述增强数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

在实施中，第一智能合约中可以设置有通过预设的多种不同的隐私预算，对上述增强数据进行差分隐私处理的相关规则信息，这样，基于第一智能合约中的上述规则信息可以实现上述相应的处理，具体可以参见上述相关内容，在此不再赘述。

上述步骤S504中调用第一智能合约，通过预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果的处理方式可以多种多样，以下提供一种可选的处理方式，具体可以包括以下内容：调用第一智能合约，通过预设的多种不同的隐私预算，采用预设的差分隐私算法分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，该差分隐私算法包括基于拉普拉斯机制的差分隐私算法、基于指数机制的差分隐私算法和基于高斯机制的差分隐私算法中的一种或多种。

上述内容的处理方式可以多种多样，以下提供一种可选的处理方式，具体可以包括以下步骤D2～步骤D6的处理。

在步骤D2中，基于第一智能合约，获取目标数据对应的向量的维度的数量。

在步骤D4中，基于第一智能合约，通过预设的多种不同的隐私预算和上述维度的数量，确定每个维度对应的隐私预算。

在步骤D6中，基于第一智能合约，采用预设的差分隐私算法和每个维度对应的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

在步骤S506中，调用第一智能合约，并基于多种不同的隐私预算对应的差分隐私结果，通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

在实施中，第一智能合约中可以设置有基于多种不同的隐私预算对应的差分隐私结果，通过预设的对比学习损失算法对目标模型进行训练的相关规则信息，这样，基于第一智能合约中的上述规则信息可以实现上述相应的处理，具体可以参见上述相关内容，在此不再赘述。

上述步骤S504～步骤S506的具体处理，可以参见上述实施例一～实施例三中的相关内容，即可以通过相应的智能合约，实现如上述实施例一～实施例三中的涉及的各种处理。

本说明书实施例提供一种基于隐私保护的数据处理方法，应用于区块链系统，获取基于隐私保护的对比学习的规则信息，采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并将第一智能合约部署到所述区块链系统中，当获取到待处理的目标数据时，调用第一智能合约，通过预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，目标数据包括连续型结构化数据和/或图像类数据，然后，调用第一智能合约，并基于多种不同的隐私预算对应的差分隐私结果，通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型，这样，通过构造隐私保护的数据来实现隐私保护的自监督对比学习，达到了预训练的同时不泄露用户隐私的目的，此外，本技术方案适用于图像类数据和其他连续型结构化数据，应用范围较广，而且本技术方案提供了可控的隐私保护机制，该隐私保护机制同时也能用于控制对比学习中正样本的相似程度等。

实施例五

以上为本说明书实施例提供的基于隐私保护的数据处理方法，基于同样的思路，本说明书实施例还提供一种基于隐私保护的数据处理装置，如图6所示。

该基于隐私保护的数据处理装置包括：数据获取模块601、差分隐私模块602和对比学习模块603，其中：

数据获取模块601，获取待处理的目标数据，所述目标数据包括连续型结构化数据和/或图像类数据；

差分隐私模块602，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果；

对比学习模块603，基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

本说明书实施例中，所述差分隐私模块602，通过预设的多种不同的隐私预算，采用预设的差分隐私算法分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，所述差分隐私算法包括基于拉普拉斯机制的差分隐私算法、基于指数机制的差分隐私算法和基于高斯机制的差分隐私算法中的一种或多种。

本说明书实施例中，所述差分隐私模块602，包括：

数量确定单元，获取所述目标数据对应的向量的维度的数量；

隐私预算单元，基于预设的多种不同的隐私预算和所述维度的数量，确定每个维度对应的隐私预算；

差分隐私单元，采用预设的差分隐私算法和每个维度对应的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

本说明书实施例中，所述目标数据包括图像类数据，所述装置还包括：

数据增强模块，根据所述隐私预算的数量，分别对所述目标数据进行数据增强处理，得到多个增强数据；

所述差分隐私模块602，通过预设的多种不同的隐私预算，对所述增强数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

本说明书实施例中，所述数据增强模块，包括：

方式确定单元，根据所述隐私预算的数量，确定对所述目标数据进行数据增强处理所需采用的处理方式；

数据增强单元，根据所述隐私预算的数量，通过确定的处理方式分别对所述目标数据进行数据增强处理，得到多个增强数据。

本说明书实施例中，所述确定的处理方式为预设的一种处理方式，或，所述确定的处理方式包括多种不同的处理方式，所述确定的处理方式包括随机旋转和图像裁剪中的一种或多种。

本说明书实施例中，所述隐私预算基于所述目标数据对应的向量的维度信息和对所述目标数据的隐私保护的目标确定。

本说明书实施例提供一种基于隐私保护的数据处理装置，获取待处理的目标数据，目标数据包括连续型结构化数据和/或图像类数据，然后，可以通过预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型，这样，通过构造隐私保护的数据来实现隐私保护的自监督对比学习，达到了预训练的同时不泄露用户隐私的目的，此外，本技术方案适用于图像类数据和其他连续型结构化数据，应用范围较广，而且本技术方案提供了可控的隐私保护机制，该隐私保护机制同时也能用于控制对比学习中正样本的相似程度等。

实施例六

基于同样的思路，本说明书实施例还提供一种基于隐私保护的数据处理装置，该装置为区块链系统中的装置，如图7所示。

该基于隐私保护的数据处理装置包括：合约部署模块701、差分隐私模块702和对比学习模块703，其中：

合约部署模块701，获取基于隐私保护的对比学习的规则信息，采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并将所述第一智能合约部署到所述区块链系统中；

差分隐私模块702，当获取到待处理的目标数据时，调用所述第一智能合约，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，所述目标数据包括连续型结构化数据和/或图像类数据；

对比学习模块703，调用所述第一智能合约，并基于多种不同的隐私预算对应的差分隐私结果，通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

本说明书实施中，所述差分隐私模块702，调用所述第一智能合约，通过预设的多种不同的隐私预算，采用预设的差分隐私算法分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，所述差分隐私算法包括基于拉普拉斯机制的差分隐私算法、基于指数机制的差分隐私算法和基于高斯机制的差分隐私算法中的一种或多种。

本说明书实施中，所述差分隐私模块702，包括：

数量确定单元，基于所述第一智能合约，获取所述目标数据对应的向量的维度的数量；

隐私预算单元，基于所述第一智能合约，通过预设的多种不同的隐私预算和所述维度的数量，确定每个维度对应的隐私预算；

差分隐私单元，基于所述第一智能合约，采用预设的差分隐私算法和每个维度对应的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

本说明书实施中，所述目标数据包括图像类数据，所述装置还包括：

数据增强模块，基于预先部署于所述区块链系统中的第二智能合约，根据所述隐私预算的数量，分别对所述目标数据进行数据增强处理，得到多个增强数据；

所述差分隐私模块702，调用所述第一智能合约，通过预设的多种不同的隐私预算，对所述增强数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

本说明书实施中，所述数据增强模块，包括：

方式确定单元，基于所述第二智能合约，根据所述隐私预算的数量，确定对所述目标数据进行数据增强处理所需采用的处理方式；

数据增强单元，基于所述第二智能合约，根据所述隐私预算的数量，通过确定的处理方式分别对所述目标数据进行数据增强处理，得到多个增强数据。

本说明书实施中，所述确定的处理方式为预设的一种处理方式，或，所述确定的处理方式包括多种不同的处理方式，所述确定的处理方式包括随机旋转和图像裁剪中的一种或多种。

本说明书实施中，所述隐私预算基于所述目标数据对应的向量的维度信息和对所述目标数据的隐私保护的目标确定。

本说明书实施例提供一种基于隐私保护的数据处理装置，获取基于隐私保护的对比学习的规则信息，采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并将第一智能合约部署到所述区块链系统中，当获取到待处理的目标数据时，调用第一智能合约，通过预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，目标数据包括连续型结构化数据和/或图像类数据，然后，调用第一智能合约，并基于多种不同的隐私预算对应的差分隐私结果，通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型，这样，通过构造隐私保护的数据来实现隐私保护的自监督对比学习，达到了预训练的同时不泄露用户隐私的目的，此外，本技术方案适用于图像类数据和其他连续型结构化数据，应用范围较广，而且本技术方案提供了可控的隐私保护机制，该隐私保护机制同时也能用于控制对比学习中正样本的相似程度等。

实施例七

以上为本说明书实施例提供的基于隐私保护的数据处理装置，基于同样的思路，本说明书实施例还提供一种基于隐私保护的数据处理设备，如图8所示。

所述基于隐私保护的数据处理设备可以为上述实施例提供终端设备、服务器或区块链系统中的设备等。

基于隐私保护的数据处理设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器801和存储器802，存储器802中可以存储有一个或一个以上存储应用程序或数据。其中，存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括对基于隐私保护的数据处理设备中的一系列计算机可执行指令。更进一步地，处理器801可以设置为与存储器802通信，在基于隐私保护的数据处理设备上执行存储器802中的一系列计算机可执行指令。基于隐私保护的数据处理设备还可以包括一个或一个以上电源803，一个或一个以上有线或无线网络接口804，一个或一个以上输入输出接口805，一个或一个以上键盘806。

具体在本实施例中，基于隐私保护的数据处理设备包括有存储器，以及一个或一个以上的程序，其中一个或者一个以上程序存储于存储器中，且一个或者一个以上程序可以包括一个或一个以上模块，且每个模块可以包括对基于隐私保护的数据处理设备中的一系列计算机可执行指令，且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令：

获取待处理的目标数据，所述目标数据包括连续型结构化数据和/或图像类数据；

通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果；

基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

本说明书实施中，所述通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，包括：

通过预设的多种不同的隐私预算，采用预设的差分隐私算法分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，所述差分隐私算法包括基于拉普拉斯机制的差分隐私算法、基于指数机制的差分隐私算法和基于高斯机制的差分隐私算法中的一种或多种。

本说明书实施中，所述通过预设的多种不同的隐私预算，采用预设的差分隐私算法分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，包括：

获取所述目标数据对应的向量的维度的数量；

基于预设的多种不同的隐私预算和所述维度的数量，确定每个维度对应的隐私预算；

采用预设的差分隐私算法和每个维度对应的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

本说明书实施中，所述目标数据包括图像类数据，所述通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果之前，还包括：

根据所述隐私预算的数量，分别对所述目标数据进行数据增强处理，得到多个增强数据；

所述通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，包括：

通过预设的多种不同的隐私预算，对所述增强数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

本说明书实施中，所述根据所述隐私预算的数量，分别对所述目标数据进行数据增强处理，得到多个增强数据，包括：

根据所述隐私预算的数量，确定对所述目标数据进行数据增强处理所需采用的处理方式；

根据所述隐私预算的数量，通过确定的处理方式分别对所述目标数据进行数据增强处理，得到多个增强数据。

此外，具体在本实施例中，基于隐私保护的数据处理设备包括有存储器，以及一个或一个以上的程序，其中一个或者一个以上程序存储于存储器中，且一个或者一个以上程序可以包括一个或一个以上模块，且每个模块可以包括对基于隐私保护的数据处理设备中的一系列计算机可执行指令，且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令：

获取基于隐私保护的对比学习的规则信息，采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并将所述第一智能合约部署到所述区块链系统中；

当获取到待处理的目标数据时，调用所述第一智能合约，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，所述目标数据包括连续型结构化数据和/或图像类数据；

调用所述第一智能合约，并基于多种不同的隐私预算对应的差分隐私结果，通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

本说明书实施中，所述目标数据包括图像类数据，所述调用所述第一智能合约，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果之前，还包括：

基于预先部署于所述区块链系统中的第二智能合约，根据所述隐私预算的数量，分别对所述目标数据进行数据增强处理，得到多个增强数据；

所述调用所述第一智能合约，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，包括：

调用所述第一智能合约，通过预设的多种不同的隐私预算，对所述增强数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果。

本说明书实施例提供一种基于隐私保护的数据处理设备，获取待处理的目标数据，目标数据包括连续型结构化数据和/或图像类数据，然后，可以通过预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型，这样，通过构造隐私保护的数据来实现隐私保护的自监督对比学习，达到了预训练的同时不泄露用户隐私的目的，此外，本技术方案适用于图像类数据和其他连续型结构化数据，应用范围较广，而且本技术方案提供了可控的隐私保护机制，该隐私保护机制同时也能用于控制对比学习中正样本的相似程度等。

实施例八

进一步地，基于上述图1到图5B所示的方法，本说明书一个或多个实施例还提供了一种存储介质，用于存储计算机可执行指令信息，一种具体的实施例中，该存储介质可以为U盘、光盘、硬盘等，该存储介质存储的计算机可执行指令信息在被处理器执行时，能实现以下流程：

获取所述目标数据对应的向量的维度的数量；

此外，在另一种具体的实施例中，该存储介质可以为U盘、光盘、硬盘等，该存储介质存储的计算机可执行指令信息在被处理器执行时，能实现以下流程：

本说明书实施例提供一种存储介质，获取待处理的目标数据，目标数据包括连续型结构化数据和/或图像类数据，然后，可以通过预设的多种不同的隐私预算，分别对目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型，这样，通过构造隐私保护的数据来实现隐私保护的自监督对比学习，达到了预训练的同时不泄露用户隐私的目的，此外，本技术方案适用于图像类数据和其他连续型结构化数据，应用范围较广，而且本技术方案提供了可控的隐私保护机制，该隐私保护机制同时也能用于控制对比学习中正样本的相似程度等。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device，PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书的实施例可提供为方法、系统、或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程欺诈案例的串并设备的处理器以产生一个机器，使得通过计算机或其他可编程欺诈案例的串并设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程欺诈案例的串并设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程欺诈案例的串并设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种基于隐私保护的数据处理方法，所述方法包括：

2.根据权利要求1所述的方法，所述通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，包括：

3.根据权利要求2所述的方法，所述通过预设的多种不同的隐私预算，采用预设的差分隐私算法分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，包括：

获取所述目标数据对应的向量的维度的数量；

4.根据权利要求1所述的方法，所述目标数据包括图像类数据，所述通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果之前，所述方法还包括：

5.根据权利要求4所述的方法，所述根据所述隐私预算的数量，分别对所述目标数据进行数据增强处理，得到多个增强数据，包括：

6.根据权利要求5所述的方法，所述确定的处理方式为预设的一种处理方式，或，所述确定的处理方式包括多种不同的处理方式，所述确定的处理方式包括随机旋转和图像裁剪中的一种或多种。

7.根据权利要求1所述的方法，所述隐私预算基于所述目标数据对应的向量的维度信息和对所述目标数据的隐私保护的目标确定。

8.一种基于隐私保护的数据处理方法，应用于区块链系统，所述方法包括：

9.根据权利要求8所述的方法，所述目标数据包括图像类数据，所述调用所述第一智能合约，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果之前，所述方法还包括：

10.一种基于隐私保护的数据处理装置，所述装置包括：

数据获取模块，获取待处理的目标数据，所述目标数据包括连续型结构化数据和/或图像类数据；

差分隐私模块，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果；

对比学习模块，基于多种不同的隐私预算对应的差分隐私结果，并通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

11.一种基于隐私保护的数据处理装置，所述装置为区块链系统中的装置，所述装置包括：

合约部署模块，获取基于隐私保护的对比学习的规则信息，采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并将所述第一智能合约部署到所述区块链系统中；

差分隐私模块，当获取到待处理的目标数据时，调用所述第一智能合约，通过预设的多种不同的隐私预算，分别对所述目标数据进行差分隐私处理，得到每种隐私预算对应的差分隐私结果，所述目标数据包括连续型结构化数据和/或图像类数据；

对比学习模块，调用所述第一智能合约，并基于多种不同的隐私预算对应的差分隐私结果，通过预设的对比学习损失算法对目标模型进行训练，得到训练后的目标模型。

12.一种基于隐私保护的数据处理设备，所述基于隐私保护的数据处理设备包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器：

13.一种基于隐私保护的数据处理设备，所述设备为区块链系统中的设备，所述基于隐私保护的数据处理设备包括：

处理器；以及

14.一种存储介质，所述存储介质用于存储计算机可执行指令，所述可执行指令在被处理器执行时实现以下流程：

15.一种存储介质，所述存储介质用于存储计算机可执行指令，所述可执行指令在被处理器执行时实现以下流程：

获取基于隐私保护的对比学习的规则信息，采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约，并将所述第一智能合约部署到区块链系统中；