CN113537633A

CN113537633A - 基于纵向联邦学习的预测方法、装置、设备、介质和系统

Info

Publication number: CN113537633A
Application number: CN202110909909.9A
Authority: CN
Inventors: 尹虹舒; 严梦嘉; 周旭华; 杨诗友; 李鑫超; 章枝宪
Original assignee: China Telecom Corp Ltd
Current assignee: China Telecom Corp Ltd
Priority date: 2021-08-09
Filing date: 2021-08-09
Publication date: 2021-10-22
Anticipated expiration: 2041-08-09
Also published as: CN113537633B

Abstract

本发明涉及数据安全技术领域，提供一种基于纵向联邦学习的预测方法、装置、设备、介质和系统。其中，基于纵向联邦学习的第一数据方侧的预测方法包括：响应于业务预测请求，对业务预测请求携带的用户标识进行过滤处理，获得携带过滤结果的过滤器发送至基于纵向联邦学习的第二数据方；根据用户标识获取第一特征数据，输入第一联邦模型，获得第一预测结果；接收来自第二数据方的基于过滤器获得的第二预测结果集，自第二预测结果集中提取与用户标识对应的第二预测结果；根据第一预测结果和第二预测结果，获得用户标识的目标预测结果。本发明能够在基于纵向联邦学习的在线推理过程中保护用户隐私安全，避免用户信息泄露。

Description

基于纵向联邦学习的预测方法、装置、设备、介质和系统

技术领域

本发明涉及数据安全技术领域，具体地说，涉及一种基于纵向联邦学习的预测方法、装置、设备、介质和系统。

背景技术

随着大数据的发展，大多数行业数据呈现数据孤岛现象，出于数据安全与用户隐私保护的考虑，发展出联邦学习技术。联邦学习技术按照数据集不同，分为横向联邦学习、纵向联邦学习等分支。

在纵向联邦学习中，当各参与方完成联合训练后，实际预测时由各参与方基于各自的数据使用各自的联邦模型参数计算预测结果，最后合并各参与方的预测结果获得最终结果，这一过程也称为在线推理。

图1示出纵向联邦学习中两个参与方之间的在线推理过程，参照图1所示，发起方110与响应方120之间的在线推理过程包括：S110-1，发起方110收到在线推理请求，提取数据标识，并将数据标识发送给响应方120；S110-2，发起方110根据数据标识查找己方特征数据，S110-3，发起方110使用己方联邦模型计算部分预测结果，同时，S120-2，响应方120根据数据标识查找己方特征数据，S120-3，响应方120使用己方联邦模型计算部分预测结果；最后，S110-4，发起方110合并双方预测结果，获得最终预测结果。

上述的在线推理过程中，由于发起方将与用户相关的数据标识发送给了响应方120，导致响应方120很容易根据数据标识直接定位到具体的用户，再结合联邦联合建模的业务特点，响应方120很容易推测出业务背后隐含的用户需求，导致用户隐私泄露。

以纵向联邦学习应用在金融领域的银行贷款场景为例，银行与运营商之间基于纵向联邦学习完成了金融风控模型的联合训练。银行需要通过在线推理方式进行用户的风险评分，以确定是否为其提供贷款。发起方为银行，响应方为运营商，银行一方面结合己方数据获得用户的风险预测结果，另一方面将用户的数据标识发送给运营商，以获得基于运营商数据的风险预测结果，最后结合两方预测结果获得用户的最终风险评分。而在此过程中，运营商通过银行发送的数据标识，可以精确了解到哪些用户存在贷款需求，存在极大的信息泄露风险。

需要说明的是，上述背景技术部分公开的信息仅用于加强对本发明的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

有鉴于此，本发明提供一种基于纵向联邦学习的预测方法、装置、设备、介质和系统，能够在基于纵向联邦学习的在线推理过程中保护用户隐私安全，避免用户信息泄露。

本发明的一个方面提供一种基于纵向联邦学习的预测方法，应用于基于纵向联邦学习的第一数据方，所述预测方法包括：响应于业务预测请求，对所述业务预测请求携带的用户标识进行过滤处理，获得携带过滤结果的过滤器发送至基于纵向联邦学习的第二数据方；根据所述用户标识获取第一特征数据，输入第一联邦模型，获得第一预测结果；接收来自所述第二数据方的基于所述过滤器获得的第二预测结果集，自所述第二预测结果集中提取与所述用户标识对应的第二预测结果；根据所述第一预测结果和所述第二预测结果，获得所述用户标识的目标预测结果。

在一些实施例中，上述的预测方法还包括：接收来自所述第二数据方的公钥；所述获得第一预测结果后，使用所述公钥加密所述第一预测结果，获得加密后的第一预测结果，且所述第二预测结果为使用所述公钥加密后的第二预测结果；所述获得所述用户标识的目标预测结果时，聚合所述加密后的第一预测结果和所述加密后的第二预测结果，并对聚合结果进行盲化处理，获得盲化后的预测结果发送至所述第二数据方；以及，接收来自所述第二数据方的对所述盲化后的预测结果进行解密的解密结果，对所述解密结果进行去盲化处理，获得所述目标预测结果。

在一些实施例中，所述对聚合结果进行盲化处理，包括：生成一随机数，将所述随机数与所述聚合结果相乘；所述对所述解密结果进行去盲化处理，包括：将所述解密结果与所述随机数相除。

在一些实施例中，所述对所述业务预测请求携带的用户标识进行过滤处理，包括：提取所述业务预测请求携带的用户标识；使用过滤器对所述用户标识进行过滤处理，所述过滤器的过滤规则能够使根据所述过滤结果获得包含所述用户标识的数据集。

本发明的又一个方面提供一种基于纵向联邦学习的预测装置，部署于基于纵向联邦学习的第一数据方，所述预测装置包括：业务响应模块，用于响应于业务预测请求，对所述业务预测请求携带的用户标识进行过滤处理，获得携带过滤结果的过滤器发送至基于纵向联邦学习的第二数据方；第一预测模块，用于根据所述用户标识获取第一特征数据，输入第一联邦模型，获得第一预测结果；联邦对接模块，用于接收来自所述第二数据方的基于所述过滤器获得的第二预测结果集，自所述第二预测结果集中提取与所述用户标识对应的第二预测结果；结果获取模块，用于根据所述第一预测结果和所述第二预测结果，获得所述用户标识的目标预测结果。

本发明的又一个方面提供一种基于纵向联邦学习的预测方法，应用于基于纵向联邦学习的第二数据方，所述预测方法包括：接收来自基于纵向联邦学习的第一数据方的携带过滤结果的过滤器，根据所述过滤器的过滤规则获得包含所述过滤结果对应的用户标识的数据集；根据所述数据集获取第二特征数据集，将所述第二特征数据集中的每条第二特征数据输入第二联邦模型，获得第二预测结果，并形成第二预测结果集发送至所述第一数据方。

在一些实施例中，上述的预测方法还包括：生成密钥对，将所述密钥对中的公钥发送至所述第一数据方；所述获得第二预测结果后，使用所述公钥加密所述第二预测结果，获得加密后的第二预测结果，并形成加密后的第二预测结果集；以及，接收来自所述第一数据方的预测结果，使用所述密钥对中的私钥解密所述预测结果，获得解密结果发送至所述第一数据方。

在一些实施例中，所述生成密钥对，包括：根据同态加密算法，生成包含所述公钥和所述私钥的密钥对。

本发明的又一个方面提供一种基于纵向联邦学习的预测装置，部署于基于纵向联邦学习的第二数据方，所述预测装置包括：联邦响应模块，用于接收来自基于纵向联邦学习的第一数据方的携带过滤结果的过滤器，根据所述过滤器的过滤规则获得包含所述过滤结果对应的用户标识的数据集；第二预测模块，用于根据所述数据集获取第二特征数据集，将所述第二特征数据集中的每条第二特征数据输入第二联邦模型，获得第二预测结果，并形成第二预测结果集发送至所述第一数据方。

本发明的又一个方面提供一种电子设备，包括：一处理器；一存储器，所述存储器中存储有可执行指令；其中，所述可执行指令被所述处理器执行时，实现上述任意实施例描述的基于纵向联邦学习的预测方法。

本发明的又一个方面提供一种计算机可读的存储介质，用于存储程序，所述程序被处理器执行时实现上述任意实施例描述的基于纵向联邦学习的预测方法。

本发明的又一个方面提供一种基于纵向联邦学习的预测方法，应用于基于纵向联邦学习的第一数据方和第二数据方，所述预测方法包括：所述第一数据方响应于业务预测请求，对所述业务预测请求携带的用户标识进行过滤处理，获得携带过滤结果的过滤器发送至所述第二数据方，且所述第一数据方根据所述用户标识获取第一特征数据，输入第一联邦模型，获得第一预测结果；所述第二数据方根据所述过滤器的过滤规则获得包含所述过滤结果对应的用户标识的数据集，根据所述数据集获取第二特征数据集，将所述第二特征数据集中的每条第二特征数据输入第二联邦模型，获得第二预测结果，并形成第二预测结果集发送至所述第一数据方；所述第一数据方自所述第二预测结果集中提取与所述用户标识对应的第二预测结果，并根据所述第一预测结果和所述第二预测结果，获得所述用户标识的目标预测结果。

在一些实施例中，上述的预测方法还包括：所述第二数据方生成密钥对，将所述密钥对中的公钥发送至所述第一数据方；所述第一数据方获得所述第一预测结果后，使用所述公钥加密所述第一预测结果，获得加密后的第一预测结果；所述第二数据方获得所述第二预测结果后，使用所述公钥加密所述第二预测结果，获得加密后的第二预测结果，并形成加密后的第二预测结果集；以及，所述第一数据方聚合所述加密后的第一预测结果和所述加密后的第二预测结果，并对聚合结果进行盲化处理，获得盲化后的预测结果发送至所述第二数据方；所述第二数据方使用所述密钥对中的私钥解密所述盲化后的预测结果，获得解密结果发送至所述第一数据方；所述第一数据方对所述解密结果进行去盲化处理，获得所述目标预测结果。

本发明的又一个方面提供一种基于纵向联邦学习的预测系统，包括：基于纵向联邦学习的第一数据方；基于纵向联邦学习的第二数据方；所述第一数据方和所述第二数据方用于实现上述任意实施例描述的基于纵向联邦学习的预测方法。

本发明与现有技术相比的有益效果至少包括：

本发明在基于纵向联邦学习的在线推理过程中，通过第一数据方对用户标识进行过滤处理，使第二数据方根据过滤器只能获得包含过滤结果对应的用户标识以及其他混淆数据的数据集，实现扩大数据范围，使第二数据方无法精确定位到用户标识对应的用户，从而保护第一数据方的用户隐私安全，避免用户信息泄露；

进一步地，本发明在基于纵向联邦学习的在线推理过程中，还可利用支持常数密态倍乘的同态加密算法和随机数乘法盲化，使整个在线推理过程交互双方均无法推理出对方的数据，进一步保证在线推理过程中的交互数据的安全性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。显而易见地，下面描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出现有技术的纵向联邦学习中两个参与方之间的推理过程示意图；

图2示出本发明一实施例中第一数据方侧的基于纵向联邦学习的预测方法的步骤示意图；

图3示出本发明又一实施例中第一数据方侧的基于纵向联邦学习的预测方法的步骤示意图；

图4示出本发明一实施例中第一数据方侧的基于纵向联邦学习的预测装置的模块示意图；

图5示出本发明一实施例中第二数据方侧的基于纵向联邦学习的预测方法的步骤示意图；

图6示出本发明又一实施例中第二数据方侧的基于纵向联邦学习的预测方法的步骤示意图；

图7示出本发明一实施例中第二数据方侧的基于纵向联邦学习的预测装置的模块示意图；

图8示出本发明一实施例中电子设备的结构示意图；

图9示出本发明一实施例中基于纵向联邦学习的预测方法的步骤示意图；

图10示出本发明又一实施例中基于纵向联邦学习的预测方法的步骤示意图；

图11示出本发明一实施例中基于纵向联邦学习的预测方法的场景示意图；

图12示出本发明一实施例中基于纵向联邦学习的预测系统的模块示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的实施方式。相反，提供这些实施方式使本发明全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

附图仅为本发明的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

此外，附图中所示的流程仅是示例性说明，不是必须包括所有的步骤。例如，有的步骤可以分解，有的步骤可以合并或部分合并，且实际执行的顺序有可能根据实际情况改变。具体描述时使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。需要说明的是，在不冲突的情况下，本发明的实施例及不同实施例中的特征可以相互组合。

本发明的基于纵向联邦学习的预测方法，应用于基于纵向联邦学习联合训练好联邦模型的多个参与方，包括第一数据方和第二数据方。第一数据方是接收到业务预测请求的发起方，第二数据方是发起方的响应方，可以包括一个或多个。第一数据方具有第一联邦模型，第二数据方具有第二联邦模型，第一联邦模型和第二联邦模型基于纵向联邦学习联合训练生成。

举例来说，第一数据方是银行，其拥有用户的银行记录，第二数据方是运营商，其拥有用户的消费记录，第一数据方和第二数据方基于纵向联邦学习，具体是基于纵向联邦线性回归学习算法，联合训练获得用于预测用户贷款风险的联邦模型，包括部署于第一数据方的第一联邦模型和部署于第二数据方的第二联邦模型。在实际的业务预测场景中，当第一数据方接收到用户的风险预测请求，会联合第二数据方，共同预测出用户的风险预测结果。

当然，本发明的预测方法并不限于上述的举例，而可以应用至任意合适的基于纵向联邦学习的业务预测场景。下面分别从第一数据方侧和第二数据方侧，详细说明本发明的基于纵向联邦学习的预测方法。

图2示出一实施例中第一数据方侧的基于纵向联邦学习的预测方法的主要步骤，参照图2所示，本实施例中基于纵向联邦学习的预测方法应用于基于纵向联邦学习的第一数据方，包括如下步骤。

步骤S220，响应于业务预测请求，对业务预测请求携带的用户标识进行过滤处理，获得携带过滤结果的过滤器发送至基于纵向联邦学习的第二数据方。

业务预测请求由第一数据方对接的业务系统发出，例如是用户风险预测请求。业务预测请求携带用户标识，可以是用户的手机号等能唯一对应用户身份的数据标识。对业务预测请求携带的用户标识进行过滤处理时，先提取业务预测请求携带的用户标识，再使用过滤器对用户标识进行过滤处理，过滤器的过滤规则能够使根据过滤结果获得包含用户标识的数据集。

过滤器可以根据需要进行选择。以用户标识为手机号举例，过滤器可以使用布隆过滤器(Bloom Filter)，通过布隆过滤器对当前手机号进行哈希运算，获得运算结果，将携带运算结果的布隆过滤器发送至第二数据方；后续，第二数据方根据布隆过滤器的过滤规则对运算结果进行哈希逆运算，即能获得包含该当前手机号，以及其他手机号的数据集。仍以用户标识为手机号举例，过滤器的过滤规则可以是自手机号中固定地或随机地取若干位。例如，一当前手机号由11位数字组成，采用过滤器进行过滤处理后，自该当前手机号中随机地取出了第一位、第四位、第五位、第八位和第九位，形成过滤结果，并将携带过滤结果的过滤器，也即存储了过滤结果和过滤规则的过滤器发送至第二数据方；后续，第二数据方根据过滤器的过滤规则对过滤结果进行逆运算，将手机号中被过滤掉的几位数字，即第二位、第三位、第六位、第七位、第十位和第十一位补足，即能获得包含该当前手机号，以及其他手机号的数据集。

在其他实施例中，过滤器的过滤规则还可以是：隐藏身份证号的最后6位，隐藏手机号的最后4位，隐藏哈希值的最后10个比特位，等等。

通过第一数据方对用户标识进行过滤处理，使第二数据方根据过滤器只能获得包含过滤结果对应的用户标识以及其他混淆数据的数据集，实现扩大数据范围，使第二数据方无法精确定位到用户标识对应的用户，从而保护第一数据方的用户隐私安全，避免用户信息泄露。

步骤S230，根据用户标识获取第一特征数据，输入第一联邦模型，获得第一预测结果。

自业务预测请求中提取出用户标识后，第一数据方可根据用户标识自其数据库中查找与用户标识匹配的第一特征数据，并输入其本地部署的第一联邦模型，以预测获得第一预测结果。

步骤S240，接收来自第二数据方的基于过滤器获得的第二预测结果集，自第二预测结果集中提取与用户标识对应的第二预测结果。

如上所述，第二数据方接收到携带过滤结果的过滤器后，能够根据过滤器的过滤规则对过滤结果进行逆处理，获得包含真实的用户标识以及其他混淆数据的数据集。第二数据方会根据数据集获得对应的特征数据，并预测出对应的第二预测结果集。第二数据方将数据集和第二预测结果集发送给第一数据方，数据集和第二预测结果集存在一一对应关系，而数据集中的某条数据又与真实的用户标识具有对应关系，因此第一数据方能够根据接收到的数据集和第二预测结果集，提取出与用户标识对应的第二预测结果。

S250，根据第一预测结果和第二预测结果，获得用户标识的目标预测结果。

第一数据方可以将第一预测结果和第二预测结果合并相加，以获得最终的针对用户标识对应的用户的目标预测结果。

图3示出又一实施例中第一数据方侧的基于纵向联邦学习的预测方法的主要步骤。本实施例相对于图2所示的实施例，新增步骤S210，将步骤S230替换为步骤S230’，将步骤S250替换为步骤S250’和步骤S250”，其余相同的步骤标号代表相同的处理步骤，对于相同的处理步骤不再重复说明。参照图3所示，本实施例中预测方法包括如下步骤。

步骤S210，接收来自第二数据方的公钥。

在线推理过程开始之前，第二数据方预先生成密钥对，并将公钥发送给第一数据方。密钥对具体可根据同态加密算法生成。

步骤S230’，根据用户标识获取第一特征数据，输入第一联邦模型，获得第一预测结果；使用公钥加密第一预测结果，获得加密后的第一预测结果。

第一数据方获得第一预测结果后，进一步使用公钥加密第一预测结果，且来自第二数据方的第二预测结果也是使用公钥加密后的第二预测结果。

步骤S240，接收来自第二数据方的加密后的第二预测结果集，自加密后的第二预测结果集中提取与用户标识对应的加密后的第二预测结果。

加密后的第二预测结果集仍然与数据集保持一一对应关系，且其中一条加密后的第二预测结果与用户标识具有对应关系，以使第一数据方能够自加密后的第二预测结果集中提取出与用户标识对应的加密后的第二预测结果。

步骤S250’，聚合加密后的第一预测结果和加密后的第二预测结果，并对聚合结果进行盲化处理，获得盲化后的预测结果发送至第二数据方。

第一数据方获得用户标识的目标预测结果时，先对加密后的第一预测结果和加密后的第二预测结果进行聚合计算，即合并加密后的第一预测结果和加密后的第二预测结果；再对聚合结果进行盲化处理，以使第二数据方对盲化后的预测结果进行解密时无法对应到真实的用户。

在一个实施例中，可采用随机数乘法盲化对聚合结果进行盲化处理。具体来说，对聚合结果进行盲化处理，包括：生成一随机数，将随机数与聚合结果相乘。

步骤S250”，接收来自第二数据方的对盲化后的预测结果进行解密的解密结果，对解密结果进行去盲化处理，获得用户标识的目标预测结果。

第二数据方可利用生成的密钥对中的秘钥对盲化后的预测结果进行解密，并将解密结果发送给第一数据方。从而，第一数据方对解密结果进行去盲化处理，例如将解密结果与上述的随机数相除，即可获得用户标识的目标预测结果。

本实施例中，在基于纵向联邦学习的在线推理过程中利用支持常数密态倍乘的同态加密算法和随机数乘法盲化，使整个在线推理过程交互双方均无法推理出对方的数据，进一步保证在线推理过程中的交互数据，即第一数据方与第二数据方之间的交互数据的安全性。

本发明实施例还提供一种基于纵向联邦学习的预测装置，可用于实现图2或图3实施例描述的预测方法。上述实施例描述的预测方法的特征和原理均可应用至下面的预测装置实施例。在下面的预测装置实施例中，对已经阐明的纵向联邦学习预测过程的特征和原理不再重复说明。

图4示出一实施例中第一数据方侧的基于纵向联邦学习的预测装置的主要模块，参照图4所示，本实施例中基于纵向联邦学习的预测装置部署于基于纵向联邦学习的第一数据方，预测装置300包括：业务响应模块310，用于响应于业务预测请求，对业务预测请求携带的用户标识进行过滤处理，获得携带过滤结果的过滤器发送至基于纵向联邦学习的第二数据方；第一预测模块320，用于根据用户标识获取第一特征数据，输入第一联邦模型，获得第一预测结果；联邦对接模块330，用于接收来自第二数据方的基于过滤器获得的第二预测结果集，自第二预测结果集中提取与用户标识对应的第二预测结果；结果获取模块340，用于根据第一预测结果和第二预测结果，获得用户标识的目标预测结果。

进一步地，预测装置300还可包括实现上述的预测方法实施例的其他流程步骤的模块，各个模块的具体原理可参照上述的预测方法实施例的描述，此处不再重复说明。

如上所述，本实施例的基于纵向联邦学习的预测装置，能够在基于纵向联邦学习的在线推理过程中，通过第一数据方对用户标识进行过滤处理，使第二数据方根据过滤器只能获得包含过滤结果对应的用户标识以及其他混淆数据的数据集，实现扩大数据范围，使第二数据方无法精确定位到用户标识对应的用户，从而保护第一数据方的用户隐私安全，避免用户信息泄露；进一步地，还可利用支持常数密态倍乘的同态加密算法和随机数乘法盲化，使整个在线推理过程交互双方均无法推理出对方的数据，进一步保证在线推理过程中的交互数据的安全性。

下面从第二数据方侧，对基于纵向联邦学习的预测方法进行详细说明。对上述实施例中已经阐明的关于基于纵向联邦学习的预测过程的特征和原理不再重复说明。

图5示出一实施例中第二数据方侧的基于纵向联邦学习的预测方法的主要步骤。参照图5所述，本实施例中基于纵向联邦学习的预测方法应用于基于纵向联邦学习的第二数据方，包括如下步骤。

步骤S420，接收来自基于纵向联邦学习的第一数据方的携带过滤结果的过滤器，根据过滤器的过滤规则获得包含过滤结果对应的用户标识的数据集。

如上所述，第二数据方根据过滤器的过滤规则对过滤结果进行逆处理，即能获得包含过滤结果对应的真实用户标识以及其他混淆数据的数据集。由于扩大了数据范围，使第二数据方无法精确定位到用户标识对应的用户，从而保护第一数据方的用户隐私安全，避免用户信息泄露。

步骤S430，根据数据集获取第二特征数据集，将第二特征数据集中的每条第二特征数据输入第二联邦模型，获得第二预测结果，并形成第二预测结果集发送至第一数据方。

计算出数据集后，第二数据方自其数据库中查找与数据集中的每条数据匹配的第二特征数据，形成第二特征数据集；并将每条第二特征数据输入其本地部署的第二联邦模型，预测获得第二预测结果，最终形成与数据集对应的第二预测结果集发送至第一数据方，以使第一数据方根据第一预测结果和第二预测结果，获得最终的目标预测结果。

图6示出又一实施例中第二数据方侧的基于纵向联邦学习的预测方法的主要步骤。本实施例相对于图5所示的实施例，新增步骤S410，将步骤S430替换为步骤S430’，并新增步骤S440，其余相同的步骤标号代表相同的处理步骤，对于相同的处理步骤不再重复说明。

参照图6所示，本实施例的预测方法包括如下步骤。

步骤S410，生成密钥对，将密钥对中的公钥发送至第一数据方。

如上所述，在线推理过程开始之前，第二数据方预先根据同态加密算法，生成包含公钥和私钥的密钥对，并将公钥发送给第一数据方。

步骤S430’，根据数据集获取第二特征数据集，将第二特征数据集中的每条第二特征数据输入第二联邦模型，获得第二预测结果；使用公钥加密第二预测结果，获得加密后的第二预测结果，并形成加密后的第二预测结果集发送至第一数据方。

第二数据方获得第二预测结果后，进一步使用公钥加密第二预测结果，以保护在线推理过程的交互数据的安全性。

步骤S440，接收来自第一数据方的预测结果，使用密钥对中的私钥解密预测结果，获得解密结果发送至第一数据方。

来自第一数据方的预测结果具体是盲化后的预测结果。第二数据方使用私钥对盲化后的预测结果进行解密，以获得解密结果发送至第一数据方。通过同态加密算法和随机数乘法盲化，能够进一步保证在线推理过程的交互数据的安全性。

本发明实施例还提供一种基于纵向联邦学习的预测装置，可用于实现图5或图6实施例描述的预测方法。上述实施例描述的预测方法的特征和原理均可应用至下面的预测装置实施例。在下面的预测装置实施例中，对已经阐明的纵向联邦学习预测过程的特征和原理不再重复说明。

图7示出一实施例中第二数据方侧的基于纵向联邦学习的预测装置的主要模块。参照图7所示，本实施例中基于纵向联邦学习的预测装置部署于基于纵向联邦学习的第二数据方，预测装置500包括：联邦响应模块510，用于接收来自基于纵向联邦学习的第一数据方的携带过滤结果的过滤器，根据过滤器的过滤规则获得包含过滤结果对应的用户标识的数据集；第二预测模块520，用于根据数据集获取第二特征数据集，将第二特征数据集中的每条第二特征数据输入第二联邦模型，获得第二预测结果，并形成第二预测结果集发送至第一数据方。

进一步地，预测装置500还可包括实现上述的预测方法实施例的其他流程步骤的模块，各个模块的具体原理可参照上述的预测方法实施例的描述，此处不再重复说明。

本发明实施例还提供一种电子设备，包括处理器和存储器，存储器中存储有可执行指令，可执行指令被处理器执行时，实现上述任意实施例描述的基于纵向联邦学习的预测方法。例如，电子设备可部署于第一数据方，以实现图2和图3实施例描述的预测方法，或者部署于第二数据方，实现图5和图6实施例描述的预测方法。

如上所述，本发明的电子设备能够在基于纵向联邦学习的在线推理过程中，通过第一数据方对用户标识进行过滤处理，使第二数据方根据过滤器只能获得包含过滤结果对应的用户标识以及其他混淆数据的数据集，实现扩大数据范围，使第二数据方无法精确定位到用户标识对应的用户，从而保护第一数据方的用户隐私安全，避免用户信息泄露；进一步地，还可利用支持常数密态倍乘的同态加密算法和随机数乘法盲化，使整个在线推理过程交互双方均无法推理出对方的数据，进一步保证在线推理过程中的交互数据的安全性。

图8是本发明实施例中电子设备的结构示意图，应当理解的是，图8仅仅是示意性地示出各个模块，这些模块可以是虚拟的软件模块或实际的硬件模块，这些模块的合并、拆分及其余模块的增加都在本发明的保护范围之内。

如图8所示，电子设备600以通用计算设备的形式表现。电子设备600的组件包括但不限于：至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。

其中，存储单元存储有程序代码，程序代码可以被处理单元610执行，使得处理单元610执行上述任意实施例描述的基于纵向联邦学习的预测方法的步骤。

存储单元620可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202，还可以进一步包括只读存储单元(ROM)6203。

存储单元620还可以包括具有一个或多个程序模块6205的程序/实用工具6204，这样的程序模块6205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线630可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备600也可以与一个或多个外部设备6000通信，外部设备6000可以是键盘、指向设备、蓝牙设备等设备中的一种或多种。这些外部设备6000使得用户能与该电子设备600进行交互通信。电子设备600也能与一个或多个其它计算设备进行通信，所示计算机设备包括路由器、调制解调器。这种通信可以通过输入/输出(I/O)接口650进行。并且，电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备600使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。

本发明实施例还提供一种计算机可读的存储介质，用于存储程序，程序被执行时实现上述任意实施例描述的基于纵向联邦学习的预测方法。在一些可能的实施方式中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序产品在终端设备上运行时，程序代码用于使终端设备执行上述任意实施例描述的基于纵向联邦学习的预测方法。例如，存储介质中存储的程序可被第一数据方的处理器执行，以实现图2和图3实施例描述的预测方法，或者被第二数据方的处理器执行，实现图5和图6实施例描述的预测方法。

如上所述，本发明的计算机可读的存储介质能够在基于纵向联邦学习的在线推理过程中，通过第一数据方对用户标识进行过滤处理，使第二数据方根据过滤器只能获得包含过滤结果对应的用户标识以及其他混淆数据的数据集，实现扩大数据范围，使第二数据方无法精确定位到用户标识对应的用户，从而保护第一数据方的用户隐私安全，避免用户信息泄露；进一步地，还可利用支持常数密态倍乘的同态加密算法和随机数乘法盲化，使整个在线推理过程交互双方均无法推理出对方的数据，进一步保证在线推理过程中的交互数据的安全性。

程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，其可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子包括但不限于：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备，例如利用因特网服务提供商来通过因特网连接。

下面以第一数据方和第二数据方之间的交互过程为例，对基于纵向联邦学习的预测方法进行详细说明。其中关于第一数据方侧和第二数据方侧的具体推理过程可参见上述的预测方法实施例，不再重复说明。

图9示出一实施例中基于纵向联邦学习的预测方法的主要步骤，参照图9所示，本实施例的基于纵向联邦学习的预测方法应用于基于纵向联邦学习的第一数据方和第二数据方，包括如下步骤。

步骤S720，第一数据方响应于业务预测请求，对业务预测请求携带的用户标识进行过滤处理，获得携带过滤结果的过滤器发送至第二数据方，且第一数据方根据用户标识获取第一特征数据，输入第一联邦模型，获得第一预测结果。

步骤S730，第二数据方根据过滤器的过滤规则获得包含过滤结果对应的用户标识的数据集，根据数据集获取第二特征数据集，将第二特征数据集中的每条第二特征数据输入第二联邦模型，获得第二预测结果，并形成第二预测结果集发送至第一数据方。

步骤S740，第一数据方自第二预测结果集中提取与用户标识对应的第二预测结果，并根据第一预测结果和第二预测结果，获得用户标识的目标预测结果。

进一步地，基于纵向联邦学习的预测方法还包括：第二数据方生成密钥对，将密钥对中的公钥发送至第一数据方；第一数据方获得第一预测结果后，使用公钥加密第一预测结果，获得加密后的第一预测结果；第二数据方获得第二预测结果后，使用公钥加密第二预测结果，获得加密后的第二预测结果，并形成加密后的第二预测结果集；以及，第一数据方聚合加密后的第一预测结果和加密后的第二预测结果，并对聚合结果进行盲化处理，获得盲化后的预测结果发送至第二数据方；第二数据方使用密钥对中的私钥解密盲化后的预测结果，获得解密结果发送至第一数据方；第一数据方对解密结果进行去盲化处理，获得目标预测结果。

具体来说，参见图10示出的基于纵向联邦学习的预测方法，第一数据方800a与第二数据方800b之间的在线推理过程包括：

步骤S810，第二数据方800b基于同态加密算法生成同态加密公钥私钥对，并将公钥发送给第一数据方800a。

步骤S820，第一数据方800a收到在线推理请求，处理用户标识形成过滤器，并将过滤器发送给第二数据方800b。从而，能够防止第二数据方800b精确定位到用户标识对应的用户，保护第一数据方800a的用户隐私安全。

步骤S830a，第一数据方800a根据用户标识预测出第一预测结果并加密；步骤S830b，第二数据方800b根据过滤器预测出多条第二预测结果并加密，发送给第一数据方800a。第一数据方800a和第二数据方800b均使用预生成的公钥对各自的预测结果进行加密。

步骤S840，第一数据方800a进行同态密文聚合，即合并加密后的第一预测结果和对应的加密后的第二预测结果，并进行随机数乘法盲化，将盲化结果发送给第二数据方800b。

步骤S850，第二数据方800b使用私钥对盲化结果进行解密，再将解密结果发送给第一数据方800a。本步骤进一步保证在线推理过程中交互数据的安全性。

步骤S860，第一数据方800a对解密结果进行去盲化，即获得最终的目标预测结果。

图11示出一实施例中基于纵向联邦学习的预测方法的示例场景，参照图11所示，在一个具体示例场景中，第一数据方800a与第二数据方800b之间的在线推理过程包括：

步骤S810’，第二数据方800b预先生成同态加密算法的公私钥对(PK,SK)，并将公钥PK发送给第一数据方800a。

步骤S820’，第一数据方800a收到业务系统的在线推理请求，使用过滤器F_id处理用户标识id，并将过滤器F_id发送给第二数据方800b，以保护第一数据方800a的数据安全。

第一数据方800a和第二数据方800b同步进行：步骤S830a’，第一数据方800a根据用户标识id查找己方的特征数据

使用己方的部分联邦模型并计算部分预测结果

使用公钥PK对部分预测结果

进行加密，得到密文

步骤S830b’，第二数据方800b根据过滤器F_id生成数据集I_id，并查找己方的与数据集I_id对应的特征数据集

针对特征数据集

中的每条数据i，使用己方的部分联邦模型计算部分预测结果

(i∈I_id)，并使用公钥PK进行加密得到密文

最终形成部分预测结果集的密文集合

最后将密文集合

以及数据集I_id发送给第一数据方800a。

步骤S840’，第一数据方800a通过数据集I_id从集合

中提取出与用户标识id对应的部分预测结果密文

并进行聚合计算得到聚合结果

第一数据方800a进一步生成随机数

并与聚合结果[y_id]_PK相乘，得到盲化结果

并将盲化结果

发送给第二数据方800b。

步骤S850’，第二数据方800b使用私钥SK对盲化结果

进行解密，得到解密结果

并将解密结果

发送给第一数据方800a。

步骤S860’，第一数据方800a对解密结果

进行去盲化操作，得到最终的目标预测结果y_id。

上述的基于纵向联邦学习的预测方法，能够在基于纵向联邦学习的在线推理过程中，通过第一数据方对用户标识进行过滤处理，使第二数据方根据过滤器只能获得包含过滤结果对应的用户标识以及其他混淆数据的数据集，实现扩大数据范围，使第二数据方无法精确定位到用户标识对应的用户，从而保护第一数据方的用户隐私安全，避免用户信息泄露；进一步地，还可利用支持常数密态倍乘的同态加密算法和随机数乘法盲化，使整个在线推理过程交互双方均无法推理出对方的数据，进一步保证在线推理过程中的交互数据的安全性。

本发明实施例还提供一种基于纵向联邦学习的预测装置，可用于实现上述实施例描述的预测方法。上述实施例描述的预测方法的特征和原理均可应用至下面的预测装置实施例。在下面的预测装置实施例中，对已经阐明的基于纵向联邦学习的预测过程的特征和原理不再重复说明。

图12示出一实施例中基于纵向联邦学习的预测系统的主要模块，参照图12所示，本实施例中基于纵向联邦学习的预测系统900包括：基于纵向联邦学习的第一数据方910；基于纵向联邦学习的第二数据方920；第一数据方910和第二数据方920用于实现上述实施例的基于纵向联邦学习的预测方法，保护第一数据方910的用户隐私安全，避免用户信息泄露，并确保第一数据方910和第二数据方920之间的交互数据的安全性。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于纵向联邦学习的预测方法，应用于基于纵向联邦学习的第一数据方，其特征在于，所述预测方法包括：

响应于业务预测请求，对所述业务预测请求携带的用户标识进行过滤处理，获得携带过滤结果的过滤器发送至基于纵向联邦学习的第二数据方；

根据所述用户标识获取第一特征数据，输入第一联邦模型，获得第一预测结果；

接收来自所述第二数据方的基于所述过滤器获得的第二预测结果集，自所述第二预测结果集中提取与所述用户标识对应的第二预测结果；

根据所述第一预测结果和所述第二预测结果，获得所述用户标识的目标预测结果。

2.如权利要求1所述的预测方法，其特征在于，还包括：

接收来自所述第二数据方的公钥；

所述获得第一预测结果后，使用所述公钥加密所述第一预测结果，获得加密后的第一预测结果，且所述第二预测结果为使用所述公钥加密后的第二预测结果；

所述获得所述用户标识的目标预测结果时，聚合所述加密后的第一预测结果和所述加密后的第二预测结果，并对聚合结果进行盲化处理，获得盲化后的预测结果发送至所述第二数据方；以及

接收来自所述第二数据方的对所述盲化后的预测结果进行解密的解密结果，对所述解密结果进行去盲化处理，获得所述目标预测结果。

3.如权利要求2所述的预测方法，其特征在于，所述对聚合结果进行盲化处理，包括：生成一随机数，将所述随机数与所述聚合结果相乘；

所述对所述解密结果进行去盲化处理，包括：将所述解密结果与所述随机数相除。

4.如权利要求1所述的预测方法，其特征在于，所述对所述业务预测请求携带的用户标识进行过滤处理，包括：

提取所述业务预测请求携带的用户标识；

使用过滤器对所述用户标识进行过滤处理，所述过滤器的过滤规则能够使根据所述过滤结果获得包含所述用户标识的数据集。

5.一种基于纵向联邦学习的预测装置，部署于基于纵向联邦学习的第一数据方，其特征在于，所述预测装置包括：

业务响应模块，用于响应于业务预测请求，对所述业务预测请求携带的用户标识进行过滤处理，获得携带过滤结果的过滤器发送至基于纵向联邦学习的第二数据方；

第一预测模块，用于根据所述用户标识获取第一特征数据，输入第一联邦模型，获得第一预测结果；

联邦对接模块，用于接收来自所述第二数据方的基于所述过滤器获得的第二预测结果集，自所述第二预测结果集中提取与所述用户标识对应的第二预测结果；

结果获取模块，用于根据所述第一预测结果和所述第二预测结果，获得所述用户标识的目标预测结果。

6.一种基于纵向联邦学习的预测方法，应用于基于纵向联邦学习的第二数据方，其特征在于，所述预测方法包括：

接收来自基于纵向联邦学习的第一数据方的携带过滤结果的过滤器，根据所述过滤器的过滤规则获得包含所述过滤结果对应的用户标识的数据集；

根据所述数据集获取第二特征数据集，将所述第二特征数据集中的每条第二特征数据输入第二联邦模型，获得第二预测结果，并形成第二预测结果集发送至所述第一数据方。

7.如权利要求6所述的预测方法，其特征在于，还包括：

生成密钥对，将所述密钥对中的公钥发送至所述第一数据方；

所述获得第二预测结果后，使用所述公钥加密所述第二预测结果，获得加密后的第二预测结果，并形成加密后的第二预测结果集；以及

接收来自所述第一数据方的预测结果，使用所述密钥对中的私钥解密所述预测结果，获得解密结果发送至所述第一数据方。

8.如权利要求7所述的预测方法，其特征在于，所述生成密钥对，包括：根据同态加密算法，生成包含所述公钥和所述私钥的密钥对。

9.一种基于纵向联邦学习的预测装置，部署于基于纵向联邦学习的第二数据方，其特征在于，所述预测装置包括：

联邦响应模块，用于接收来自基于纵向联邦学习的第一数据方的携带过滤结果的过滤器，根据所述过滤器的过滤规则获得包含所述过滤结果对应的用户标识的数据集；

第二预测模块，用于根据所述数据集获取第二特征数据集，将所述第二特征数据集中的每条第二特征数据输入第二联邦模型，获得第二预测结果，并形成第二预测结果集发送至所述第一数据方。

10.一种电子设备，其特征在于，包括：

一处理器；

一存储器，所述存储器中存储有可执行指令；

其中，所述可执行指令被所述处理器执行时，实现如权利要求1-4任一项所述的基于纵向联邦学习的预测方法，或者实现如权利要求6-8任一项所述的基于纵向联邦学习的预测方法。

11.一种计算机可读的存储介质，用于存储程序，其特征在于，所述程序被处理器执行时实现如权利要求1-4任一项所述的基于纵向联邦学习的预测方法，或者实现如权利要求6-8任一项所述的基于纵向联邦学习的预测方法。

12.一种基于纵向联邦学习的预测方法，应用于基于纵向联邦学习的第一数据方和第二数据方，其特征在于，所述预测方法包括：

所述第一数据方响应于业务预测请求，对所述业务预测请求携带的用户标识进行过滤处理，获得携带过滤结果的过滤器发送至所述第二数据方，且所述第一数据方根据所述用户标识获取第一特征数据，输入第一联邦模型，获得第一预测结果；

所述第二数据方根据所述过滤器的过滤规则获得包含所述过滤结果对应的用户标识的数据集，根据所述数据集获取第二特征数据集，将所述第二特征数据集中的每条第二特征数据输入第二联邦模型，获得第二预测结果，并形成第二预测结果集发送至所述第一数据方；

所述第一数据方自所述第二预测结果集中提取与所述用户标识对应的第二预测结果，并根据所述第一预测结果和所述第二预测结果，获得所述用户标识的目标预测结果。

13.如权利要求12所述的预测方法，其特征在于，还包括：

所述第二数据方生成密钥对，将所述密钥对中的公钥发送至所述第一数据方；

所述第一数据方获得所述第一预测结果后，使用所述公钥加密所述第一预测结果，获得加密后的第一预测结果；

所述第二数据方获得所述第二预测结果后，使用所述公钥加密所述第二预测结果，获得加密后的第二预测结果，并形成加密后的第二预测结果集；以及

所述第一数据方聚合所述加密后的第一预测结果和所述加密后的第二预测结果，并对聚合结果进行盲化处理，获得盲化后的预测结果发送至所述第二数据方；

所述第二数据方使用所述密钥对中的私钥解密所述盲化后的预测结果，获得解密结果发送至所述第一数据方；

所述第一数据方对所述解密结果进行去盲化处理，获得所述目标预测结果。

14.一种基于纵向联邦学习的预测系统，其特征在于，包括：

基于纵向联邦学习的第一数据方；

基于纵向联邦学习的第二数据方；

所述第一数据方和所述第二数据方用于实现如权利要求12或13所述的基于纵向联邦学习的预测方法。