WO2021147487A1

WO2021147487A1 - 一种数据处理方法及装置

Info

Publication number: WO2021147487A1
Application number: PCT/CN2020/129124
Authority: WO
Inventors: 衣志昊; 程勇; 刘洋; 陈天健
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2020-01-21
Filing date: 2020-11-16
Publication date: 2021-07-29
Also published as: CN111291801B; CN111291801A

Abstract

一种数据处理方法及装置，涉及金融科技(Fintech)领域，用以解决现有技术无法训练得到通用的检测模型的问题。其中方法包括：联邦服务器联合各参与方设备的待训练数据，确定公共切割点处的公共切割特征，根据公共切割点处的公共切割特征构建得到检测模型并下发给各参与方设备，以便于各参与方设备使用检测模型检测待检测数据的异常性。通过联合各参与方设备的待训练数据确定公共切割点处的公共切割特征，使得公共切割特征能同时反映各参与方设备的数据特性，如此，基于该种公共切割特征构建得到检测模型，能使检测模型准确地检测各参与方设备中的异常数据，检测模型的通用性较好，异常检测的准确率较高。

Description

一种数据处理方法及装置

相关申请的交叉引用

本申请要求在2020年01月21日提交中国专利局、申请号为202010072413.6、申请名称为“一种数据处理方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及金融科技(Fintech)技术领域，尤其涉及一种数据处理方法及装置。

背景技术

随着计算机技术的发展，越来越多的技术应用在金融领域，传统金融业正在逐步向金融科技(Fintech)转变.然而，由于金融行业的安全性和实时性要求较高，金融科技领域也对技术提出了更高的要求。异常数据检测是金融领域常用的一种数据处理方法，在对海量交易数据进行处理时，通过使用检测模型检测出海量交易数据中的异常交易数据，能够便于运维人员及时检测异常交易场景，提高金融领域的稳定性。

现阶段，各个参与方设备通常仅能使用本地存储的待训练数据训练检测模型。然而，由于单一参与方设备训练的检测模型无法反映其他参与方设备的数据特性，因此，单一参与方设备训练的检测模型仅能准确检测该参与方设备的异常数据，而无法检测出其他参与方设备的异常数据，或者会误判其他参与方设备的异常数据，从而导致异常数据的检测准确率较低。

发明内容

本发明提供一种数据处理方法及装置，用以训练得到通用的检测模型，以实现对各个参与方设备的异常数据进行检测，进而提升异常数据检测的准确率。

第一方面，本发明提供一种数据处理方法，该方法应用于联邦服务器，该方法包括：联邦服务器联合各个参与方设备的待训练数据，确定各个参与方设备在公共切割点处的公共切割特征，根据公共切割点处的公共切割特征构建得到检测模型，并将检测模型下发给各个参与方设备，以使各个参与方设备使用检测模型对待检测数据进行检测，从而确定待检测数据是否为异常数据。其中，公共切割特征为对异常数据与正常数据进行区分的特征。

在一种可能的实现方式中，公共切割特征可以包括公共切割特征维度和公共切割特征值。在这种情况下，联邦服务器联合各个参与方设备的待训练数据，确定各个参与方设备在公共切割点处的公共切割特征，包括：联邦服务器根据各个参与方设备在公共切割点处的待训练数据的特征维度，确定公共切割点处的公共切割特征维度，并将公共切割点处的公共切割特征维度下发给各个参与方设备，以使参与方设备基于公共切割点处的公共切割特征维度确定参与方设备在公共切割特征维度下的切割特征值，之后，联邦服务器接收各个参与方设备上报的各个参与方设备在公共切割特征维度下的切割特征值，并根据各个参与方设备在公共特征维度下的切割特征值，确定公共切割特征值。

在一种可能的实现方式中，联邦服务器根据各个参与方设备在公共切割点处的待训练数据的特征维度，确定公共切割点处的公共特征维度，包括：联邦服务器根据各个参与方设备在公共切割点处的待训练数据的特征维度，确定各个参与方设备在公共切割点处的待训练数据的公共特征维度，进而从公共特征维度中选取公共切割特征维度。

在一种可能的实现方式中，联邦服务器根据公共切割点处的公共切割特征，构建得到检测模型，包括：联邦服务器关联任一公共切割点与公共切割点处的公共切割特征，之后根据各个参与方设备在各个公共切割点处的待训练数据的包含关系，连接各个公共切割点，得到二叉树模型，并将二叉树模型作为检测模型。

在一种可能的实现方式中，联邦服务器联合各个参与方设备的待训练数据，确定各个参与方设备在公共切割点处的公共切割特征，包括：联邦服务器联合各个参与方设备在任一次训练中的待训练数据，确定各个参与方设备在任一次训练对应的公共切割点处的公共切割特征，之后根据公共切割点处的公共切割特征构建得到任一次训练对应的检测模型。相应地，并将检测模型下发给各个参与方设备，包括：联邦服务器将各次训练对应的检测模型下发给各个参与方设备，以使各个参与方设备使用各次训练对应的检测模型对待检测数据进行检测，以确定待检测数据是否为异常数据。

第二方面，本发明提供一种数据处理方法，该方法应用于参与方设备，该方法包括：参与方设备接收联邦服务器发送的检测模型，并使用检测模型对待检测数据进行检测，以确定待检测数据是否为异常数据。其中，检测模型为联邦服务器联合各个参与方设备的待训练数据，确定各个参与方设备在公共切割点处的公共切割特征，根据公共切割点处的公共切割特征构建得到的，公共切割特征用于区分异常数据与正常数据。

在一种可能的实现方式中，参与方设备接收联邦服务器发送的检测模型之前，还接收联邦服务器下发的公共切割点处的公共切割特征维度，基于公共切割点处的公共切割特征维度确定参与方设备在公共切割特征维度下的切割特征值，将参与方设备在公共切割特征维度下的切割特征值上报给联邦服务器，以使联邦服务器根据各个参与方设备在公共特征维度下的切割特征值，确定公共切割特征值。其中，公共切割点处的公共切割特征维度为联邦服务器根据各个参与方设备在公共切割点处的待训练数据的特征维度确定的。

在一种可能的实现方式中，参与方设备使用检测模型对待检测数据进行检测，以确定待检测数据是否为异常数据，包括：参与方设备使用各个公共切割点处的公共切割特征对待检测数据进行切割，确定待检测数据最终被切到的公共切割点，若最终被切到的公共切割点对应的权重大于第一预设阈值，则确定待检测数据为异常数据，否则确定待检测数据为正常数据。

在一种可能的实现方式中，参与方设备接收联邦服务器发送的检测模型，包括：参与方设备接收联邦服务器发送的各次训练对应的检测模型。相应地，参与方设备使用检测模型对待检测数据进行检测，以确定待检测数据是否为异常数据，包括：参与方设备使用任一次训练对应的检测模型中的各个公共切割点处的公共切割特征对待检测数据进行切割，确定待检测数据在任一次训练对应的检测模型中最终被切到的公共切割点，计算待检测数据在各次训练对应的检测模型中最终被切到的公共切割点对应的平均权重，若平均权重大于第二预设阈值，则确定待检测数据为异常数据，否则确定待检测数据为正常数据。

第三方面，本发明提供一种数据处理装置，该装置包括：确定模块，用于联合各个参与方设备的待训练数据，确定各个参与方设备在公共切割点处的公共切割特征；构建模块，用于根据公共切割点处的公共切割特征，构建得到检测模型；收发模块，用于将检测模型下发给各个参与方设备，以使各个参与方设备还用于使用检测模型对待检测数据进行检测，以确定待检测数据是否为异常数据。其中，公共切割特征为对异常数据与正常数据进行区分的特征。

在一种可能的实现方式中，公共切割特征可以包括公共切割特征维度和公共切割特征值。在这种情况下，确定模块具体用于：根据各个参与方设备在公共切割点处的待训练数据的特征维度，确定公共切割点处的公共切割特征维度，将公共切割点处的公共切割特征维度下发给各个参与方设备，以使参与方设备基于公共切割点处的公共切割特征维确定参与方设备在公共切割特征维度下的切割特征值。之后，确定模块接收各个参与方设备上报的各个参与方设备在公共切割特征维度下的切割特征值，并根据各个参与方设备在公共特征维度下的切割特征值，确定公共切割特征值。

在一种可能的实现方式中，确定模块具体用于：根据各个参与方设备在公共切割点处的待训练数据的特征维度，确定各个参与方设备在公共切割点处的待训练数据的公共特征维度，并从公共特征维度中选取公共切割特征维度。

在一种可能的实现方式中，构建模块具体用于：关联任一公共切割点与公共切割点处的公共切割特征，根据各个参与方设备在各个公共切割点处的待训练数据的包含关系，连接各个公共切割点，得到二叉树模型，将该二叉树模型作为检测模型。

在一种可能的实现方式中，确定模块具体用于：联合各个参与方设备在任一次训练中的待训练数据，确定各个参与方设备在任一次训练对应的公共切割点处的公共切割特征，根据公共切割点处的公共切割特征，构建得到任一次训练对应的检测模型。相应地，收发模块具体用于：将各次训练对应的检测模型下发给各个参与方设备，以使各个参与方设备使用各次训练对应的检测模型对待检测数据进行检测，以确定待检测数据是否为异常数据。

第四方面，本发明提供一种数据处理装置，该装置包括：收发模块，用于接收联邦服务器发送的检测模型；检测模块，用于使用检测模型对待检测数据进行检测，以确定待检测数据是否为异常数据。其中，检测模型为联邦服务器联合各个参与方设备的待训练数据，确定各个参与方设备在公共切割点处的公共切割特征，根据公共切割点处的公共切割特征构建得到的；公共切割特征用于区分异常数据与正常数据。

在一种可能的实现方式中，收发模块接收联邦服务器发送的检测模型之前，还接收联邦服务器下发的公共切割点处的公共切割特征维度，基于公共切割点处的公共切割特征维度确定参与方设备在公共切割特征维度下的切割特征值，将参与方设备在公共切割特征维度下的切割特征值上报给联邦服务器，以使联邦服务器还用于根据各个参与方设备在公共特征维度下的切割特征值，确定公共切割特征值。其中，公共切割点处的公共切割特征维度为联邦服务器根据各个参与方设备在公共切割点处的待训练数据的特征维度确定的。

在一种可能的实现方式中，检测模块具体用于：使用各个公共切割点处的公共切割特征对待检测数据进行切割，确定待检测数据最终被切到的公共切割点，若最终被切到的公共切割点对应的权重大于第一预设阈值，则确定待检测数据为异常数据，否则确定待检测数据为正常数据。

在一种可能的实现方式中，收发模块具体用于：接收联邦服务器发送的各次训练对应的检测模型。相应地，检测模块具体用于：使用任一次训练对应的检测模型中的各个公共切割点处的公共切割特征对待检测数据进行切割，确定待检测数据在任一次训练对应的检测模型中最终被切到的公共切割点，计算待检测数据在各次训练对应的检测模型中最终被切到的公共切割点对应的平均权重，若平均权重大于第二预设阈值，则确定待检测数据为异常数据，否则确定待检测数据为正常数据。

第五方面，本发明提供一种计算设备，包括至少一个处理单元以及至少一个存储单元，其中，所述存储单元存储有计算机程序，当所述程序被所述处理单元执行时，使得所述处理单元执行上述第一方面或第二方面任意所述的方法。

第六方面，本发明提供的一种计算机可读存储介质，其存储有可由计算设备执行的计算机程序，当所述程序在所述计算设备上运行时，使得所述计算设备执行上述第一方面或第二方面任意所述的方法。

在本发明中，通过联合各个参与方设备的待训练数据确定公共切割点处的公共切割特征，使得公共切割特征能够同时反映各个参与方设备的数据特性，如此，基于公共切割特征构建得到的检测模型能够准确地对各个参与方设备的异常数据进行检测，检测模型的通用性较好，检测的准确率较高。

本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种适用的系统架构示意图；

图2为本发明实施例提供的一种数据处理方法对应的流程示意图；

图3为本发明实施例提供的一种确定公共切割特征的流程方法示意图；

图4为参与方设备在各个公共切割点处的待训练数据的分布示意图；

图5为本发明实施例提供的一种确定下一公共切割点的方法流程示意图；

图6为本发明实施例提供的一种检测模型的结构示意图；

图7为本发明实施例提供的一种数据处理装置的结构示意图；

图8为本发明实施例提供的另一种数据处理装置的结构示意图；

图9为本发明实施例提供的一种终端设备的结构示意图；

图10为本发明实施例提供的一种后端设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

图1为本发明实施例提供的一种适用的系统架构示意图，如图1所示，该系统架构可以包括联邦服务器110和至少两个参与方设备，比如参与方设备121、参与方设备122和参与方设备123。其中，联邦服务器110可以与每个参与方设备连接，比如可以通过有线方式连接，也可以通过无线方式连接，具体不作限定。

基于图1所示意的系统架构，图2为本发明实施例提供的一种数据处理方法对应的交互流程示意图，该方法适用于联邦服务器和参与方设备，例如图1所示意出的联邦服务器 110和任一参与方设备，如参与方设备121、参与方设备122或参与方设备123。如图2所示，该方法包括：

步骤201，联邦服务器联合各个参与方设备的待训练数据，确定各个参与方设备在公共切割点处的公共切割特征。

本发明实施例中，公共切割点是在对各个参与方设备的待训练数据进行切割时联合各个参与方设备确定出的统一的切割节点，各个参与方设备在公共切割点处对应有各自的待训练数据，联邦服务器能够联合各个参与方设备在公共切割点处的待训练数据确定公共切割点处的公共切割特征，然后下发给各个参与方设备。相应地，任一参与方设备使用公共切割点处的公共切割特征对该参与方设备在公共切割点处的待训练数据进行切割，得到后续的公共切割点，即将该参与方设备在公共切割点处的待训练数据切割至后续的公共切割点中，循环执行上述过程，直至切割至无法切割时，相应地也得到了各个公共切割点和各个公共切割点处的公共切割特征。其中，公共切割特征为对异常数据与正常数据进行区分的特征。正常数据与异常数据是相对于各个待训练数据来说的，正常数据是指与大部分待训练数据特征相似的数据，而异常数据是指与大部分待训练数据特征差异较大的数据。

步骤202，联邦服务器根据公共切割点处的公共切割特征，构建得到检测模型。

步骤203，联邦服务器将检测模型下发给各个参与方设备。

步骤204，各个参与方设备使用检测模型对待检测数据进行检测，以确定待检测数据是否为异常数据。

本发明实施例中，通过联合各个参与方设备的待训练数据确定公共切割点处的公共切割特征，使得公共切割特征能够同时反映各个参与方设备的数据特性。如此，基于公共切割特征构建得到的检测模型能够准确地对各个参与方设备的异常数据进行检测，检测模型的通用性较好，检测的准确率较高。

在上述步骤201中，联邦服务器可以通过如下图3所示意的方式确定各个参与方设备在任一公共切割点处的公共切割特征。其中，公共切割特征可以包括公共切割特征维度和公共切割特征值。

图3为本发明实施例提供的一种确定任一公共切割点处的公共切割特征的流程方法示意图，该方法适用于联邦服务器和参与方设备，例如图1所示意出的联邦服务器110和任一参与方设备，如参与方设备121、参与方设备122或参与方设备123。如图3所示，该方法包括：

步骤301，联邦服务器根据各个参与方设备在公共切割点处的待训练数据的特征维度，确定公共切割点处的公共切割特征维度。

在一个示例中，针对于任一公共切割点，联邦服务器110可以先根据各个参与方设备在公共切割点处的待训练数据的特征维度，确定各个参与方设备在公共切割点处的待训练数据的公共特征维度，然后再从公共特征维度中选取该公共切割点处的公共切割特征维度。其中，确定各个参与方设备在公共切割点处的待训练数据的特征维度的方式可以有多种，比如，联邦服务器110可以向各个参与方设备发送维度获取请求，维度获取请求中携带有公共切割点的标识，以使各个参与方设备可以根据维度获取请求确定各个参与方设备在公共切割点处的待训练数据的特征维度并上报。或者，各个参与方设备也可以按照固定周期或实时上报各个参与方设备在公共切割点处的待训练数据的特征维度，不作限定。

在一种可能的方式中，任意两次公共切割点处的公共切割特征维度可以不同。具体实施中，在执行模型训练之前，联邦服务器110可以先获取每个参与方设备中待训练数据的特征维度，然后使用各个参与方设备中待训练数据的公共特征维度构建公共特征维度集合。如此，针对于任一公共切割点，联邦服务器110可以先从公共特征维度集合中确定出与其它公共切割点处的公共切割特征维度不同的各个公共特征维度，然后从各个公共特征维度中选取一个作为各个参与方设备在公共切割点处的公共切割特征维度。

在该方式中，公共特征维度集合可以具有如下几种可能的情形：

情形一，公共特征维度集合中仅存储有与其它公共切割点处的公共切割特征维度不同的公共特征维度。

具体实施中，针对于任一公共切割点，联邦服务器110可以直接从公共特征维度集合中随机选择一个公共特征维度，并将该公共特征维度作为各个参与方在该公共切割点处的公共切割特征维度。相应地，在该公共切割点切割结束后，联邦服务器110可以将各个参与方在该公共切割点处的公共切割特征维度从公共特征维度集合中删除，以使公共特征维度集合中仅存储与各个参与方在其它公共切割点处的公共切割特征维度不同的公共特征维度。

情形二，公共特征维度集合中存储有全部公共特征维度以及全部公共特征维度的状态；任一公共特征维度的状态为已选状态或未选状态，已选状态用于指示公共特征维度为其它公共切割点处的公共切割特征维度，未选状态用于指示公共特征维度不为其它公共切割点处的公共切割特征维度。

具体实施中，针对于任一公共切割点，联邦服务器110可以先从公共特征维度集合中确定出每个公共特征维度的状态，再从状态为未选状态的公共特征维度中随机选择一个公共特征维度，将该公共特征维度作为公共切割点处的公共切割特征维度。相应地，在公共切割点切割结束后，联邦服务器110可以将公共特征维度集合中公共切割点处的公共切割特征维度的状态更新为已选状态，以实时更新公共特征维度集合中每个公共特征维度的状态，保证公共切割特征维度确定的准确性。

在上述方式中，通过选取与其它公共切割点处的公共切割特征维度不同的公共特征维度作为公共切割点处的公共切割特征维度，使得各个公共切割点均能使用不同的特征维度进行切割，从而能够更加均衡的利用各个特征维度的数据特征切割待训练数据，提高公共切割点处的公共切割特征的准确性。

步骤302，联邦服务器将公共切割点处的公共切割特征维度下发给各个参与方设备。

步骤303，参与方设备基于公共切割点处的公共切割特征维度确定参与方设备在公共切割特征维度下的切割特征值。

在上述步骤303中，公共切割点可以为第1至第N级公共切割层中的任一公共切割点，第1级公共切割层中的公共切割点为根公共切割点，参与方设备在根公共切割点处的待训练数据包括该参与方设备在模型训练中的全部待训练数据。相应地，第i(0<i<N-2，且为整数)级公共切割层中的公共切割点为中间公共切割点或叶子公共切割点，第i级公共切割层中的任一中间公共切割点连接第i+1级公共切割层中的至少一个公共切割点，参与方设备在第i级公共切割层中的任一中间公共切割点处的待训练数据包括该参与方设备在该中间公共切割点所连接的第i+1级公共切割层中的全部公共切割点处的待训练数据，而第i级公共切割层中的叶子公共切割点不连接任意的第i+1级公共切割层中的公共切割点。

举例来说，图4为参与方设备在各个公共切割点处的待训练数据的分布示意图，如图 4所示，第1级公共切割层中设置有根公共切割点A ₁，根公共切割点A ₁中包括参与方设备中的全部待训练数据，即待训练数据a ₁、待训练数据a ₂、待训练数据a ₃、待训练数据a ₄、待训练数据a ₅、待训练数据a ₆和待训练数据a ₇。相应地，根公共切割点A ₁连接第2级公共切割层中的中间公共切割点A ₂₁和叶子公共切割点A ₂₂，参与方设备在中间公共切割点A ₂₁处的待训练数据包括待训练数据a ₁、待训练数据a ₃、待训练数据a ₄、待训练数据a ₅、待训练数据a ₆和待训练数据a ₇，参与方设备在叶子公共切割点A ₂₂处的待训练数据包括待训练数据a ₂。且，中间公共切割点A ₂₁连接第3级公共切割层中的叶子公共切割点A ₃₁和叶子公共切割点A ₃₂，参与方设备在叶子公共切割点A ₃₁处的待训练数据包括待训练数据a ₁、待训练数据a ₄和待训练数据a ₇，参与方设备在叶子公共切割点A ₃₂处的待训练数据包括待训练数据a ₃、待训练数据a ₅和待训练数据a ₆。

具体实施中，针对于任一公共切割点，参与方设备可以先获取参与方设备在该公共切割点中的待训练数据，再根据该公共切割点处的公共切割特征维度，确定公共切割点中的待训练数据在该公共切割特征维度下的各个特征值。若公共切割特征维度对应为特征值离散的特征维度，则参与方设备可以从待训练数据在公共切割特征维度下的各个特征值中随机选择一个特征值，作为参与方设备在公共切割点处的切割特征值。相应地，若公共切割特征维度对应为特征值连续的特征维度，则参与方设备可以从待训练数据在公共切割特征维度下的最大特征值和最小特征值之间随机选择一个中间特征值，作为参与方设备在公共切割点处的切割特征值。其中，选择中间特征值的方式可以由本领域技术人员根据经验进行设置，比如可以随机选择中间特征值，或者也可以将最大特征值或最小特征值的平均特征值作为中间特征值，或者还可以将最大特征值或最小特征值的加权平均特征值作为中间特征值，具体不作限定。

举例来说，表1为一种参与方设备在公共切割点处的待训练数据的示意表。

表1

如表1所示，参与方设备在公共切割点A ₂₁处的待训练数据包括待训练数据a ₁、待训练数据a ₃、待训练数据a ₄、待训练数据a ₅、待训练数据a ₆和待训练数据a ₇，参与方设备在公共切割点A ₂₁处的特征维度包括消费金额、购买时间、年龄和购物类别。

具体实施中，若公共切割特征维度为消费金额，则参与方设备可以先查询表格1确定公共切割点A ₂₁处的各个待训练数据在消费金额下的各个特征值，即210、600、53、1000、860、100。进一步地，由于消费金额属于特征值连续的特征维度，因此参与方设备可以先确定公共切割点A ₂₁处的各个待训练数据在消费金额下的最大消费金额为1000，最小消费金额为53，再从[53，1000]中随机选择一个消费金额，作为参与方设备在公共切割点A ₂₁处的切割特征值，比如520。或者，若公共切割特征维度为购物类别，则参与方设备可以先查询表格1确定公共切割点A ₂₁处的待训练数据在购物类别下的各个特征值，即暖风机、家具、零食、游戏机、洗衣机、衣服。进一步地，由于购物类别属于特征值离散的特征维度，因此参与方设备可从各个特征值中随机选择一个特征值，作为参与方设备在公共切割点A ₂₁处的切割特征值，比如游戏机。

步骤304，参与方设备将参与方设备在公共切割特征维度下的切割特征值上报给联邦服务器。

步骤305，联邦服务器根据各个参与方设备在公共切割特征维度下的切割特征值，确定公共切割特征值。

具体实施中，联邦服务器110接收到各个参与方设备在公共切割特征维度下的切割特征值后，可以采用多种方式确定公共切割特征值。比如可以随机选取一个切割特征值作为公共切割特征值，或者也可以将各个切割特征值的平均切割特征值作为公共切割特征值，或者还可以将各个切割特征值的加权平均切割特征值作为公共切割特征值等，不作限定。

步骤306，联邦服务器将公共切割特征维度和公共切割特征值作为公共切割点处的公共切割特征。

本发明实施例中，参与方设备可以仅向联邦服务器上报切割特征值，而无需上报待训练数据，从而可以保护参与方设备中待训练数据的安全性，同时降低传输数据量，提高训练效率。且，由于切割特征值基于参与方设备中的待训练数据在公共切割特征维度下的特征值而生成，因此切割特征值能够准确体现参与方设备中待训练数据的数据特性。如此，基于各个参与方设备上报的切割特征值确定的公共切割特征值训练得到的检测模型能够体现各个参与方设备中待训练数据的数据特性，检测模型的通用性较好，检测准确性较高。

上述内容介绍了确定任一公共切割点处的公共切割特征维度和公共切割特征值的实现过程，下面介绍如何确定下一公共切割点。

图5为本发明实施例提供的一种确定下一公共切割点的方法流程示意图，该方法适用于联邦服务器和参与方设备，例如图1所示意出的联邦服务器110和任一参与方设备，如参与方设备121、参与方设备122或参与方设备123。如图5所示，该方法包括：

步骤501，联邦服务器将公共切割点处的公共切割特征值下发给各个参与方设备。

具体实施中，联邦服务器110可以直接将公共切割点处的公共切割特征值下发给各个参与方设备，或者也可以先对公共切割点处的公共切割特征值进行加密，再将加密的公共切割特征值下发给各个参与方设备，以保证数据传输的安全性，具体不作限定。

步骤502，参与方设备使用公共切割点处的公共切割特征值对参与方设备在公共切割点处的待训练数据进行切割，得到切割结果。

具体实施中，若参与方设备在公共切割点处的待训练数据的数量小于或等于1，则参与方设备在公共切割点处的待训练数据无法切割，因此可以确定切割结果为切割失败。相应地，若参与方设备在公共切割点处的待训练数据的数量大于1，则可以直接使用公共切割特征值对参与方设备在公共切割点处的待训练数据进行切割，并在切割完成后，确定切割结果为切割成功。

举例来说，基于表1所示意的待训练数据，当公共切割点为公共切割点A ₂₁，公共切割特征维度为消费金额500时，如图4所示，参与方设备可以使用消费金额500对参与方设备在公共切割点A ₂₁处的待训练数据a ₁、待训练数据a ₃、待训练数据a ₄、待训练数据a ₅、待训练数据a ₆和待训练数据a ₇进行切割。由于待训练数据a ₁(消费金额为210)、待训练数据a ₄(消费金额为53)和待训练数据a ₇(消费金额为100)的消费金额均小于500，因此可以将待训练数据a ₁、待训练数据a ₄和待训练数据a ₇划分至第3级公共切割层的公共切割点A ₃₁中。相应地，由于待训练数据a ₃(消费金额为600)、待训练数据a ₅(消费金额为1000)和待训练数据a ₆(消费金额为860)的消费金额均大于或等于500，因此可以将待训练数据a ₃、待训练数据a ₅和待训练数据a ₆划分至第3级公共切割层的公共切割点A ₃₂中。且，当切割完成后，参与方设备确定切割结果为切割成功。或者，当公共切割点为公共切割点A ₂₂时，如图4所示，由于参与方设备在公共切割点A ₂₂处的待训练数据仅包括待训练数据a ₂，因此，可以确定参与方设备在公共切割点A ₂₂中的待训练数据无法切割，参与方设备确定切割结果为切割失败。

需要说明的是，上述仅是一种示例性的说明，并不构成对本方案的限定，具体实施中，划分方式可以由本领域技术人员根据经验进行设置。比如也可以设置为将消费金额大于或等于500的待训练数据划分至公共切割点A ₃₁中，将消费金额小于500的待训练数据划分至公共切割点A ₃₂中。

步骤503，参与方设备将切割结果上报给联邦服务器。

步骤504，联邦服务器根据各个参与方设备的切割结果确定是否满足模型训练的结束条件，若否，则执行步骤505，若是，则执行步骤506。

本发明实施例中，模型训练的结束条件可以为以下任意一项或任意多项：公共切割点的深度(公共切割点与根公共切割点的距离)大于或等于预设切割深度、各个参与方设备中不存在未切割且可切割的公共切割点、已执行切割的次数大于或等于预设切割次数、已执行切割的时长大于或等于预设切割时长、最高一级公共切割层包括的公共切割点的数量大于或等于预设数量。通过设置上述几种结束条件，使得本发明实施例中的数据处理方法可以具有更广的应用范围，且更加满足用户的需要。

步骤505，联邦服务器联合各个参与方设备在各个公共切割点中的待训练数据，确定下一公共切割点。

为了便于理解，下面以模型训练的结束条件包括上述各项为例，描述上述步骤505和步骤506的具体实现过程：

步骤a，联邦服务器接收到各个参与方设备发送的切割结果后，先判断已执行切割的次数是否大于或等于预设切割次数，和/或，判断已执行切割的时长是否大于或等于预设切割时长，和/或，判断最高一级公共切割层包括的公共切割点的数量是否大于或等于预设数量，若存在至少一项为是，则可以确定切割结果满足模型训练的结束条件，执行步骤b，若全部为否，则执行步骤c。

步骤b，联邦服务器确定不存在下一公共切割点。

步骤c，联邦服务器根据每个参与方设备的切割结果确定每个参与方设备是否成功切割。若确定各个参与方设备均无法成功切割，则说明公共切割点为叶子公共切割点，公共切割点无法再向下切割，执行步骤e。若确定存在某一参与方设备切割成功，则判断切割得到的公共切割点的深度是否大于或等于预设深度，若否，则执行步骤d，若是，则执行步骤e。

步骤d，联邦服务器将与公共切割点连接的下一级公共切割层中的左公共切割点作为下一公共切割点。

本发明实施例中，联邦服务器若确定存在一个或多个参与方设备切割成功，且当前支路还未到达设置的切割深度，则可以继续当前支路的切割工作，即将当前支路上公共切割点连接的下一级公共切割层中的左公共切割点作为下一公共切割点。通过在当前支路的切割工作还未完成时自动执行下次切割，可以将当前支路的左公共切割点切割至无法切割或达到预设深度，从而保证切割的连续性，提高数据处理的效率。

步骤e，联邦服务器下发查询指令给各个参与方设备。

步骤f，参与方设备根据查询指令，确定参与方设备中是否存在未切割且可切割的公共切割点。若是，则将切割深度最深的未切割且可切割的公共切割点作为参与方设备中可切割的下一公共切割点。若否，则确定参与方设备中不存在下一公共切割点。

在上述步骤f中，未切割且可切割的公共切割点是指参与方设备在公共切割点中的待训练数据大于1，且公共切割点的深度小于预设切割深度的公共切割点。

具体实施中，每个参与方设备在接收到查询指令后，可以先查询确定该参与方设备中是否存在未切割且可切割的公共切割点。若存在，则可以在所有未切割且可切割的公共切割点中获取深度最深的公共切割点，并根据该公共切割点的层级关系生成查询结果。其中，公共切割点的层级关系可以包括公共切割点所在的公共切割层以及公共切割点在公共切割层中的位置。相应地，若不存在，则可以根据参与方设备中不存在下一公共切割点的指示消息生成查询结果。

步骤g，每个参与方设备将查询结果上报给联邦服务器。其中，查询结果为参与方设备中可切割的下一公共切割点的层级关系，或者为参与方设备中不存在下一公共切割点的指示消息。

步骤h，联邦服务器根据各个参与方设备上报的查询结果，若确定全部参与方设备中均不存在可切割的下一公共切割点，则确定已满足模型训练的结束条件，执行步骤b。若确定一个或多个参与方设备中存在可切割的下一公共切割点，则执行步骤i。

步骤i，联邦服务器根据一个或多个参与方设备上报的各个下一公共切割点的层级关系，选择层级最深且位置最近的公共切割点作为各个参与方设备的下一公共切割点。其中，层级最深且位置最近的公共切割点是指所在的公共切割层最深，且在公共切割层中靠近已切割的公共切割点的位置最近的公共切割点。

本发明实施例中，在将最初支路上的公共切割点切割至预设切割深度或无法切割时，联邦服务器若查询到各个参与方设备中还存在未切割且可切割的公共切割点，则可以从各个参与方设备的未切割且可切割的公共切割点中选择深度最深的公共切割点作为下一公共切割点，循环执行切割，直至各个参与方设备中均不存在未切割且可切割的公共切割点为止。由此可知，通过以切割深度为基准由深向浅对各个公共切割点进行切割，可以保证切割的有序进行，避免遗漏公共切割点，提高数据处理的准确性和检测模型的检测效果。

步骤506，联邦服务器确定不存在下一公共切割点，根据各个公共切割点处的公共切割特征构建检测模型。

在一种可能的实现方式中，联邦服务器可以采用如下方式构建得到检测模型：关联任一公共切割点与各个参与方设备在该公共切割点处的公共切割特征，根据各个参与方设备在各个公共切割点处的待训练数据的包含关系，连接各个公共切割点，得到二叉树模型，将二叉树模型作为检测模型。

图6为本发明实施例提供的一种检测模型的结构示意图，如图6所示，当预设切割深度为4时，第一次切割使用公共切割特征维度1和公共切割特征值1对任一参与方设备在公共切割点1处的待训练数据进行切割，将任一参与方设备在公共切割点1处的待训练数据切割至公共切割点2和公共切割点3中。由于此时的切割深度为2，未达到预设切割深度，因此可以将下一级公共切割层中的左公共切割点(即公共切割点2)作为下一公共切割点。基于此，第二次切割使用公共切割特征维度2和公共切割特征值2对任一参与方设备在公共切割点2处的待训练数据进行切割，将任一参与方设备在公共切割点2处的待训练数据切割至公共切割4和公共切割点5中。

相应地，此时的切割深度为3，未达到预设切割深度，因此可以将公共切割点2的下一级公共切割层中的左公共切割点(即公共切割点4)作为下一公共切割点。基于此，第三次切割使用公共切割特征维度3和公共切割特征值3对任一参与方设备在公共切割点4处的待训练数据进行切割，将任一参与方设备在公共切割点4处的待训练数据切割至公共切割点4的左样本空间和右样本空间中。由于此时的切割深度为4，已达到预设切割深度，因此联邦服务器确定当前支路不可切割。

进一步地，联邦服务器向各个参与方设备发送查询指令，并根据各个参与方设备返回的查询结果确定深度最深且可切割的公共切割点为公共切割点5，因此，将公共切割点5作为下一公共切割点。基于此，第四次切割使用公共切割特征维度4和公共切割特征值4对任一参与方设备在公共切割点5处的待训练数据进行切割，将任一参与方设备在公共切割点5处的待训练数据切割至公共切割点5的左样本空间和右样本空间中。由于此时的切割深度为4，已达到预设切割深度，因此联邦服务器确定当前支路不可切割。

相应地，联邦服务器向各个参与方设备重新发送查询指令，并根据各个参与方设备返回的查询结果确定深度最深且可切割的公共切割点为公共切割点3，因此，将公共切割点3作为下一公共切割点。基于此，第五次切割使用公共切割特征维度5和公共切割特征值5对任一参与方设备在公共切割点3处的待训练数据进行切割，将任一参与方设备在公共切割点3处的待训练数据切割至公共切割点3的左样本空间和右样本空间中。由于此时的切割深度为4，已达到预设切割深度，因此联邦服务器确定当前支路不可切割。

如此，联邦服务器继续向各个参与方设备发送查询指令，并根据各个参与方设备返回的查询结果确定各个参与方设备中不存储在可切割的公共切割点，因此联邦服务器确定已满足模型训练的结束条件。

在确定切割完成后，联邦服务器可以先关联每个公共切割点与各个参与方设备在该公共切割点处的公共切割特征，再根据各个参与方设备在各个公共切割点处的待训练数据的包含关系，连接各个公共切割点，得到图6所示意的二叉树模型，即检测模型。

本发明实施例中，联邦服务器在联合各个参与方设备确定公共切割点处的公共切割特征的同时，各个参与方设备还使用公共切割点处的公共切割特征对各个参与方设备在公共切割点处的待训练数据进行切割，如此，联邦服务器和各个参与方设备实际上实现了一边训练一边检测的同步操作效果，当训练得到检测模型时，各个参与方设备中的待训练数据也被划分到了不同的公共切割点中，从而各个参与方设备中的待训练数据的异常性也已确定。显然地，本发明实施例通过一次模型训练同时可以实现多次模型应用，在训练得到一个检测模型的过程中同步实现了对各个参与方设备中的待训练数据的检测，从而模型检测的效率更高。

本发明实施例中，联邦服务器110可以仅联合各个参与方设置执行1次模型训练，得到1个检测模型，也可以联合各个参与方设备执行多次模型训练，得到多个检测模型。若仅训练得到1个检测模型，则各个参与方可以将各自的全部待训练数据作为该次模型训练所使用的待训练数据。而若训练得到多个检测模型，则各个参与方设备在每次模型训练之前，均可以从各自的全部待训练数据中选取部分待训练数据作为每次模型训练所使用的待训练数据。其中，各个参与方设备为每次模型训练所选取的待训练数据的数量可以相同，也可以不同，同一参与方设备在各次模型训练中使用的待训练数据可以不完全相同，以保证检测模型能够集合不同待训练数据的数据特征，提高检测模型的检测效果。

在一种可能的实现方式中，联邦服务器110在执行模型训练之前，可以先向各个参与方设备下发样本确认指令。任一参与方设备接收到样本确认指令后，若确定该参与方设备的全部待训练数据的数量小于或等于预设数量，则可以将该参与方设备中的全部待训练数据作为本次模型训练的待训练数据，并将全部待训练数据作为根公共切割点中的待训练数据。相应地，若该参与方设备中的全部待训练数据的数量大于预设数量，则可以先从全部待训练数据中选取部分待训练数据作为本次模型训练的待训练数据，并将所选取的部分待训练数据作为根公共切割点中的待训练数据。在该种实现方式中，通过在待训练数据较少时将全部待训练数据作为模型训练的待训练数据，且在待训练数据较多时选取部分待训练数据作为模型训练的待训练数据，可以在充分保证待训练数据的样本多样性的同时，降低每次模型训练的数据量，在提高数据处理的效率的同时，提高检测模型的准确性。

基于此，若仅训练得到一个检测模型，则在上述步骤204中，参与方设备可以通过如下方式检测待检测数据的异常性：

针对于任一待检测数据，参与方设备可以先使用各个公共切割点处的公共切割特征对待检测数据进行切割，确定出待检测数据最终被切到的公共切割点。若最终被切到的公共切割点对应的权重大于第一预设阈值，则确定待检测数据为异常数据，否则确定待检测数据为正常数据。其中，第一预设阈值可以由本领域技术人员根据经验进行设置，或者可以根据实际需要进行设置，具体不作限定。在一个示例中，第一预设阈值可以设置为0.5。举例来说，参照图6所示意的检测模型，可以先使用公共切割点1处的公共切割特征维度1和公共切割特征值1对待检测数据进行切割，若待检测数据在公共切割特征维度1下的特征值小于或等于公共切割特征值1，则可以将待检测数据切割至公共切割点2中。若待检测数据在公共切割特征维度1下的特征值大于公共切割特征值1，则可以将待检测数据切割至公共切割点3中。以待检测数据被切割至公共切割点2中为例，参与方设备可以使用公共切割点2处的公共切割特征维度2和公共切割特征值2对待检测数据进行切割，若待检测数据在公共切割特征维度2下的特征值小于或等于公共切割特征值2，则可以将待检测数据切割至公共切割点4中。若待检测数据在公共切割特征维度2下的特征值大于公共切割特征值2，则可以将待检测数据切割至公共切割点5中。不断执行上述过程，直至待检测数据被切割至不可切割为止。

进一步地，在切割完成后，联邦服务器110可以先确定待检测数据最后被切到的公共切割点，然后获取最后被切到的公共切割点的权重。其中，任一公共切割点的权重和该公共切割点与根公共切割点的距离成反对应关系。待检测数据最终被切割到的公共切割点与根公共切割点的距离越远，说明待检测数据与大部分待训练数据越相似，待检测数据的异常程度越轻，待检测数据最终被切割到的公共切割点与根公共切割点的距离越近，说明待检测数据与大部分待训练数据的差异越大，待检测数据的异常程度越严重。基于此，在获取最后被切到的公共切割点的权重后，联邦服务器110可以判断该权重是否大于第一预设阈值，若是，则确定待检测数据为异常数据，若否，则确定待检测数据为正常数据。

其中，由于同一级公共切割层的各个公共切割点与根公共切割点的距离相同，因此可以为同一级公共切割层的各个公共切割点设置相同的权重。比如为图6中第二级公共切割层的公共切割点2和公共切割点3设置权重0.8，为第三级公共切割层的公共切割点4和公共切割点5设置权重0.3。如此，当第一预设阈值设置为0.5时，若待检测数据最后被切割到公共切割点5的右样本空间中，则确定最后被切到的公共切割点为公共切割点5。由于公共切割点5的权重为0.3(小于0.5)，因此待检测数据为正常数据。相应地，若待检测数据最后被切割到公共切割点3的左样本空间中，则确定最后被切到的公共切割点为公共切割点3，由于公共切割点3的权重为0.8(大于0.5)，因此待检测数据为异常数据。

相应地，若训练得到多个检测模型，则在上述步骤204中，参与方设备可以通过如下方式检测待检测数据的异常性：

针对于任一待检测数据，参与方设备可以先使用任一次训练对应的检测模型中的各个公共切割点处的公共切割特征对待检测数据进行切割，确定待检测数据在任一次训练对应的检测模型中最终被切到的公共切割点，然后计算待检测数据在各次训练对应的检测模型中最终被切到的公共切割点对应的平均权重。若平均权重大于第二预设阈值，则确定待检测数据为异常数据，否则确定待检测数据为正常数据。其中，第二预设阈值可以由本领域技术人员根据经验进行设置，或者可以根据实际需要进行设置，具体不作限定。在一个示例中，第二预设阈值可以设置为0.5。

需要说明的是，上述仅是一种示例性的说明，并不构成对本方案的限定。在具体实施中，参与方设备也可以计算得到最终被切到的公共切割点对应的加权平均权重，并通过对比加权平均权重和第二预设阈值来确定待检测数据的异常性。其中，加权的权值可以基于多个检测模型的损失函数来确定：若检测模型的损失函数越小，则说明检测效果越好，可以为该检测模型设置较大的权值；若检测模型的损失函数越大，则说明检测效果越差，可以为该检测模型设置较小的权值。

本发明的上述实施例中，联邦服务器联合各个参与方设备的待训练数据，确定所述各个参与方设备在公共切割点处的公共切割特征；所述公共切割特征为对异常数据与正常数据进行区分的特征；如此，联邦服务器根据所述公共切割点处的公共切割特征，构建得到检测模型，并将所述检测模型下发给所述各个参与方设备，以便于各个参与方设备使用所述检测模型对待检测数据进行检测，确定所述待检测数据是否为异常数据。本发明实施例中，通过联合各个参与方设备的待训练数据确定公共切割点处的公共切割特征，使得公共切割特征能够同时反映各个参与方设备的数据特性，如此，基于公共切割特征构建得到的检测模型能够准确地对各个参与方设备的异常数据进行检测，检测模型的通用性较好，异常检测的准确率较高。

针对上述方法流程，本发明实施例还提供一种数据处理装置，该装置的具体内容可以参照上述方法实施。

图7为本发明实施例提供的一种数据处理装置的结构示意图，如图7所示，该装置包括：

确定模块701，用于联合各个参与方设备的待训练数据，确定所述各个参与方设备在公共切割点处的公共切割特征；所述公共切割特征为对异常数据与正常数据进行区分的特征；

构建模块702，用于根据所述公共切割点处的公共切割特征，构建得到检测模型；

收发模块703，用于将所述检测模型下发给所述各个参与方设备；所述各个参与方设备还用于使用所述检测模型对待检测数据进行检测，以确定所述待检测数据是否为异常数据。

可选地，所述公共切割特征可以包括公共切割特征维度和公共切割特征值。在这种情况下，所述确定模块701具体用于：先根据所述各个参与方设备在所述公共切割点处的待训练数据的特征维度，确定所述公共切割点处的公共切割特征维度，再将所述公共切割点处的公共切割特征维度下发给所述各个参与方设备，以使各个参与方设备基于所述公共切割点处的公共切割特征维度确定所述参与方设备在所述公共切割特征维度下的切割特征值，之后，接收所述各个参与方设备上报的所述各个参与方设备在所述公共切割特征维度下的切割特征值，并根据所述各个参与方设备在所述公共特征维度下的切割特征值，确定所述公共切割特征值。

可选地，所述确定模块701具体用于：根据所述各个参与方设备在所述公共切割点处的待训练数据的特征维度，确定所述各个参与方设备在所述公共切割点处的待训练数据的公共特征维度，从所述公共特征维度中选取所述公共切割特征维度。

可选地，所述构建模块702具体用于：关联任一公共切割点与所述公共切割点处的公共切割特征，并根据所述各个参与方设备在所述各个公共切割点处的待训练数据的包含关系，连接所述各个公共切割点，得到二叉树模型，将所述二叉树模型作为所述检测模型。

可选地，所述确定模块701具体用于：联合各个参与方设备在任一次训练中的待训练数据，确定所述各个参与方设备在所述任一次训练对应的公共切割点处的公共切割特征，根据所述公共切割点处的公共切割特征，构建得到所述任一次训练对应的检测模型；

所述收发模块703具体用于：将各次训练对应的检测模型下发给所述各个参与方设备，以使所述各个参与方设备使用所述各次训练对应的检测模型对所述待检测数据进行检测，以确定所述待检测数据是否为异常数据。

图8为本发明实施例提供的另一种数据处理装置的结构示意图，如图8所示，该装置包括：

收发模块801，用于接收联邦服务器发送的检测模型；所述检测模型为所述联邦服务器联合各个参与方设备的待训练数据，确定所述各个参与方设备在公共切割点处的公共切割特征，根据所述公共切割点处的公共切割特征构建得到的；所述公共切割特征用于区分异常数据与正常数据；

检测模块802，用于使用所述检测模型对待检测数据进行检测，以确定所述待检测数据是否为异常数据。

可选地，所述收发模块801接收联邦服务器发送的检测模型之前，还用于：接收联邦服务器下发的公共切割点处的公共切割特征维度，基于所述公共切割点处的公共切割特征维度确定所述参与方设备在所述公共切割特征维度下的切割特征值，将所述参与方设备在所述公共切割特征维度下的切割特征值上报给所述联邦服务器；所述联邦服务器还用于根据所述各个参与方设备在所述公共特征维度下的切割特征值，确定所述公共切割特征值。其中，公共切割点处的公共切割特征维度为所述联邦服务器根据各个参与方设备在所述公共切割点处的待训练数据的特征维度确定的。

可选地，所述检测模块802具体用于：使用各个公共切割点处的公共切割特征对所述待检测数据进行切割，确定待检测数据最终被切到的公共切割点，若所述最终被切到的公共切割点对应的权重大于第一预设阈值，则确定所述待检测数据为异常数据，否则确定所述待检测数据为正常数据。

可选地，所述收发模块801具体用于：接收所述联邦服务器发送的各次训练对应的检测模型。对应的，所述检测模块802具体用于：使用任一次训练对应的检测模型中的各个公共切割点处的公共切割特征对待检测数据进行切割，确定待检测数据在所述任一次训练对应的检测模型中最终被切到的公共切割点，计算所述待检测数据在各次训练对应的检测模型中最终被切到的公共切割点对应的平均权重，若所述平均权重大于第二预设阈值，则确定所述待检测数据为异常数据，否则确定所述待检测数据为正常数据。

从上述内容可以看出：本发明的上述实施例中，联邦服务器联合各个参与方设备的待训练数据，确定所述各个参与方设备在公共切割点处的公共切割特征；所述公共切割特征为对异常数据与正常数据进行区分的特征；如此，联邦服务器根据所述公共切割点处的公共切割特征，构建得到检测模型，并将所述检测模型下发给所述各个参与方设备，以便于各个参与方设备使用所述检测模型对待检测数据进行检测，确定所述待检测数据是否为异常数据。本发明实施例中，通过联合各个参与方设备的待训练数据确定公共切割点处的公共切割特征，使得公共切割特征能够同时反映各个参与方设备的数据特性，如此，基于公共切割特征构建得到的检测模型能够准确地对各个参与方设备的异常数据进行检测，检测模型的通用性较好，异常检测的准确率较高。

基于同一发明构思，本发明实施例提供的一种计算设备，包括至少一个处理单元以及至少一个存储单元，其中，所述存储单元存储有计算机程序，当所述程序被所述处理单元执行时，使得所述处理单元执行上述图2至图5任意所述的方法。

基于同一发明构思，本发明实施例提供的一种计算机可读存储介质，其存储有可由计算设备执行的计算机程序，当所述程序在所述计算设备上运行时，使得所述计算设备执行图2至图5任意所述的方法。

基于相同的技术构思，本发明实施例提供了一种终端设备，如图9所示，包括至少一个处理器901，以及与至少一个处理器连接的存储器902，本发明实施例中不限定处理器901与存储器902之间的具体连接介质，图9中处理器901和存储器902之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。

在本发明实施例中，存储器902存储有可被至少一个处理器901执行的指令，至少一个处理器901通过执行存储器902存储的指令，可以执行前述的数据处理方法中所包括的步骤。

其中，处理器901是终端设备的控制中心，可以利用各种接口和线路连接终端设备的各个部分，通过运行或执行存储在存储器902内的指令以及调用存储在存储器902内的数据，从而实现数据处理。可选的，处理器901可包括一个或多个处理单元，处理器901可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理下发指令。可以理解的是，上述调制解调处理器也可以不集成到处理器901中。在一些实施例中，处理器901和存储器902可以在同一芯片上实现，在一些实施例中，它们也可以在独立的芯片上分别实现。

处理器901可以是通用处理器，例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合数据处理实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器902作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器902可以包括至少一种类型的存储介质，例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random Access Memory，RAM)、静态随机访问存储器(Static Random Access Memory，SRAM)、可编程只读存储器(Programmable Read Only Memory，PROM)、只读存储器(Read Only Memory，ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、磁性存储器、磁盘、光盘等等。存储器902是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。本发明实施例中的存储器902还可以是电路或者其它任意能够实现存储功能的装置，用于存储程序指令和/或数据。

基于相同的技术构思，本发明实施例提供了一种后端设备，如图10所示，包括至少一个处理器1001，以及与至少一个处理器连接的存储器1002，本发明实施例中不限定处理器1001与存储器1002之间的具体连接介质，图10中处理器1001和存储器1002之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。

在本发明实施例中，存储器1002存储有可被至少一个处理器1001执行的指令，至少一个处理器1001通过执行存储器1002存储的指令，可以执行前述的数据处理方法中所包括的步骤。

其中，处理器1001是后端设备的控制中心，可以利用各种接口和线路连接后端设备的各个部分，通过运行或执行存储在存储器1002内的指令以及调用存储在存储器1002内的数据，从而实现数据处理。可选的，处理器1001可包括一个或多个处理单元，处理器1001可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、应用程序等，调制解调处理器主要对接收到的指令进行解析以及对接收到的结果进行解析。可以理解的是，上述调制解调处理器也可以不集成到处理器1001中。在一些实施例中，处理器1001和存储器1002可以在同一芯片上实现，在一些实施例中，它们也可以在独立的芯片上分别实现。

处理器1001可以是通用处理器，例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合数据处理实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器1002作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器1002可以包括至少一种类型的存储介质，例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random Access Memory，RAM)、静态随机访问存储器(Static Random Access Memory，SRAM)、可编程只读存储器(Programmable Read Only Memory，PROM)、只读存储器(Read Only Memory，ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、磁性存储器、磁盘、光盘等等。存储器1002是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。本发明实施例中的存储器1002还可以是电路或者其它任意能够实现存储功能的装置，用于存储程序指令和/或数据。

本领域内的技术人员应明白，本发明的实施例可提供为方法、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

一种数据处理方法，其特征在于，应用于联邦服务器，所述方法包括：

联合各个参与方设备的待训练数据，确定所述各个参与方设备在公共切割点处的公共切割特征；所述公共切割特征为对异常数据与正常数据进行区分的特征；

根据所述公共切割点处的公共切割特征，构建得到检测模型；

将所述检测模型下发给所述各个参与方设备；所述各个参与方设备还用于使用所述检测模型对待检测数据进行检测，以确定所述待检测数据是否为异常数据。
根据权利要求1所述的方法，其特征在于，所述公共切割特征包括公共切割特征维度和公共切割特征值；

所述联合各个参与方设备的待训练数据，确定所述各个参与方设备在公共切割点处的公共切割特征，包括：

根据所述各个参与方设备在所述公共切割点处的待训练数据的特征维度，确定所述公共切割点处的公共切割特征维度；

将所述公共切割点处的公共切割特征维度下发给所述各个参与方设备，所述参与方设备还用于基于所述公共切割点处的公共切割特征维度确定所述参与方设备在所述公共切割特征维度下的切割特征值；

接收所述各个参与方设备上报的所述各个参与方设备在所述公共切割特征维度下的切割特征值，并根据所述各个参与方设备在所述公共特征维度下的切割特征值，确定所述公共切割特征值。
根据权利要求2所述的方法，其特征在于，所述根据所述各个参与方设备在所述公共切割点处的待训练数据的特征维度，确定所述公共切割点处的公共特征维度，包括：

根据所述各个参与方设备在所述公共切割点处的待训练数据的特征维度，确定所述各个参与方设备在所述公共切割点处的待训练数据的公共特征维度；从所述公共特征维度中选取所述公共切割特征维度。
根据权利要求1至3中任一项所述的方法，其特征在于，所述根据所述公共切割点处的公共切割特征，构建得到检测模型，包括：

关联任一公共切割点与所述公共切割点处的公共切割特征；

根据所述各个参与方设备在所述各个公共切割点处的待训练数据的包含关系，连接所述各个公共切割点，得到二叉树模型，将所述二叉树模型作为所述检测模型。
根据权利要求1至3中任一项所述的方法，其特征在于，所述联合各个参与方设备的待训练数据，确定所述各个参与方设备在公共切割点处的公共切割特征，包括：

联合各个参与方设备在任一次训练中的待训练数据，确定所述各个参与方设备在所述任一次训练对应的公共切割点处的公共切割特征，根据所述公共切割点处的公共切割特征，构建得到所述任一次训练对应的检测模型；

所述将所述检测模型下发给所述各个参与方设备，包括：

将各次训练对应的检测模型下发给所述各个参与方设备，以使所述各个参与方设备使用所述各次训练对应的检测模型对所述待检测数据进行检测，以确定所述待检测数据是否为异常数据。
一种数据处理方法，其特征在于，应用于参与方设备，所述方法包括：

接收联邦服务器发送的检测模型；所述检测模型为所述联邦服务器联合各个参与方设备的待训练数据，确定所述各个参与方设备在公共切割点处的公共切割特征，根据所述公共切割点处的公共切割特征构建得到的；所述公共切割特征用于区分异常数据与正常数据；

使用所述检测模型对待检测数据进行检测，以确定所述待检测数据是否为异常数据。
根据权利要求6所述的方法，其特征在于，所述接收联邦服务器发送的检测模型之前，还包括：

接收联邦服务器下发的公共切割点处的公共切割特征维度；所述公共切割点处的公共切割特征维度为所述联邦服务器根据各个参与方设备在所述公共切割点处的待训练数据的特征维度确定的；

基于所述公共切割点处的公共切割特征维度确定所述参与方设备在所述公共切割特征维度下的切割特征值；

将所述参与方设备在所述公共切割特征维度下的切割特征值上报给所述联邦服务器；所述联邦服务器还用于根据所述各个参与方设备在所述公共特征维度下的切割特征值，确定所述公共切割特征值。
根据权利要求6或7任一项所述的方法，其特征在于，所述使用所述检测模型对待检测数据进行检测，以确定所述待检测数据是否为异常数据，包括：

使用各个公共切割点处的公共切割特征对所述待检测数据进行切割，确定待检测数据最终被切到的公共切割点；

若所述最终被切到的公共切割点对应的权重大于第一预设阈值，则确定所述待检测数据为异常数据，否则确定所述待检测数据为正常数据。
根据权利要求6或7任一项所述的方法，其特征在于，所述接收联邦服务器发送的检测模型，包括：

接收所述联邦服务器发送的各次训练对应的检测模型；

所述使用所述检测模型对待检测数据进行检测，以确定所述待检测数据是否为异常数据，包括：

使用任一次训练对应的检测模型中的各个公共切割点处的公共切割特征对待检测数据进行切割，确定待检测数据在所述任一次训练对应的检测模型中最终被切到的公共切割点；

计算所述待检测数据在各次训练对应的检测模型中最终被切到的公共切割点对应的平均权重，若所述平均权重大于第二预设阈值，则确定所述待检测数据为异常数据，否则确定所述待检测数据为正常数据。
一种数据处理装置，其特征在于，所述装置包括：

确定模块，用于联合各个参与方设备的待训练数据，确定所述各个参与方设备在公共切割点处的公共切割特征；所述公共切割特征为对异常数据与正常数据进行区分的特征；

构建模块，用于根据所述公共切割点处的公共切割特征，构建得到检测模型；

收发模块，用于将所述检测模型下发给所述各个参与方设备；所述各个参与方设备还用于使用所述检测模型对待检测数据进行检测，以确定所述待检测数据是否为异常数据。
根据权利要求10所述的装置，其特征在于，所述公共切割特征包括公共切割特征维度和公共切割特征值；

所述确定模块具体用于：

根据所述各个参与方设备在所述公共切割点处的待训练数据的特征维度，确定所述公共切割点处的公共切割特征维度；

将所述公共切割点处的公共切割特征维度下发给所述各个参与方设备，所述参与方设备还用于基于所述公共切割点处的公共切割特征维度确定所述参与方设备在所述公共切割特征维度下的切割特征值；

接收所述各个参与方设备上报的所述各个参与方设备在所述公共切割特征维度下的切割特征值，并根据所述各个参与方设备在所述公共特征维度下的切割特征值，确定所述公共切割特征值。
根据权利要求11所述的装置，其特征在于，所述确定模块具体用于：

根据所述各个参与方设备在所述公共切割点处的待训练数据的特征维度，确定所述各个参与方设备在所述公共切割点处的待训练数据的公共特征维度；从所述公共特征维度中选取所述公共切割特征维度。
根据权利要求10至12中任一项所述的装置，其特征在于，所述构建模块具体用于：

关联任一公共切割点与所述公共切割点处的公共切割特征；

根据所述各个参与方设备在所述各个公共切割点处的待训练数据的包含关系，连接所述各个公共切割点，得到二叉树模型，将所述二叉树模型作为所述检测模型。
根据权利要求10至12中任一项所述的装置，其特征在于，所述确定模块具体用于：

联合各个参与方设备在任一次训练中的待训练数据，确定所述各个参与方设备在所述任一次训练对应的公共切割点处的公共切割特征，根据所述公共切割点处的公共切割特征，构建得到所述任一次训练对应的检测模型；

所述收发模块具体用于：

将各次训练对应的检测模型下发给所述各个参与方设备，以使所述各个参与方设备使用所述各次训练对应的检测模型对所述待检测数据进行检测，以确定所述待检测数据是否为异常数据。
一种数据处理装置，其特征在于，所述装置包括：

收发模块，用于接收联邦服务器发送的检测模型；所述检测模型为所述联邦服务器联合各个参与方设备的待训练数据，确定所述各个参与方设备在公共切割点处的公共切割特征，根据所述公共切割点处的公共切割特征构建得到的；所述公共切割特征用于区分异常数据与正常数据；

检测模块，用于使用所述检测模型对待检测数据进行检测，以确定所述待检测数据是否为异常数据。
根据权利要求15所述的装置，其特征在于，在所述收发模块接收联邦服务器发送的检测模型之前，所述收发模块还用于：

接收联邦服务器下发的公共切割点处的公共切割特征维度；所述公共切割点处的公共切割特征维度为所述联邦服务器根据各个参与方设备在所述公共切割点处的待训练数据的特征维度确定的；

基于所述公共切割点处的公共切割特征维度确定所述参与方设备在所述公共切割特征维度下的切割特征值；

将所述参与方设备在所述公共切割特征维度下的切割特征值上报给所述联邦服务器；所述联邦服务器还用于根据所述各个参与方设备在所述公共特征维度下的切割特征值，确定所述公共切割特征值。
根据权利要求15或16任一项所述的装置，其特征在于，所述检测模块具体用于：

使用各个公共切割点处的公共切割特征对所述待检测数据进行切割，确定待检测数据最终被切到的公共切割点；

若所述最终被切到的公共切割点对应的权重大于第一预设阈值，则确定所述待检测数据为异常数据，否则确定所述待检测数据为正常数据。
根据权利要求15或16任一项所述的装置，其特征在于，所述收发模块具体用于：

接收所述联邦服务器发送的各次训练对应的检测模型；

所述检测模块具体用于：

使用任一次训练对应的检测模型中的各个公共切割点处的公共切割特征对待检测数据进行切割，确定待检测数据在所述任一次训练对应的检测模型中最终被切到的公共切割点；

计算所述待检测数据在各次训练对应的检测模型中最终被切到的公共切割点对应的平均权重，若所述平均权重大于第二预设阈值，则确定所述待检测数据为异常数据，否则确定所述待检测数据为正常数据。
一种计算设备，其特征在于，包括至少一个处理单元以及至少一个存储单元，其中，所述存储单元存储有计算机程序，当所述程序被所述处理单元执行时，使得所述处理单元执行权利要求1～9任一权利要求所述的方法。
一种计算机可读存储介质，其特征在于，其存储有可由计算设备执行的计算机程序，当所述程序在所述计算设备上运行时，使得所述计算设备执行权利要求1～9任一权利要求所述的方法。