CN110322349A

CN110322349A - 一种数据的处理方法、装置及设备

Info

Publication number: CN110322349A
Application number: CN201910553786.2A
Authority: CN
Inventors: 陆逊
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2019-06-25
Filing date: 2019-06-25
Publication date: 2019-10-11
Anticipated expiration: 2039-06-25
Also published as: CN110322349B

Abstract

本说明书实施例公开了一种数据的处理方法、装置及设备，所述方法包括：获取目标历史业务数据，并确定所述目标历史业务数据对应的风险属性信息和空间属性信息，所述目标历史业务数据包括预定的多个维度的数据；基于所述目标历史业务数据对应的风险属性信息，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据；基于所述目标历史业务数据对应的空间属性信息，以及所述异常业务数据和非异常业务数据，对所述异常业务数据进行异常空间检测，确定所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度；根据所述聚集的程度，确定存在风险的业务数据所包含的维度的信息。

Description

一种数据的处理方法、装置及设备

技术领域

本说明书涉及计算机技术领域，尤其涉及一种数据的处理方法、装置及设备。

背景技术

随着互联网技术的飞速发展，网络交易这种全新的交易模式已经被越来越多的人所接受，并且逐渐成为人们消费的重要渠道，改变着人们的生活。然而，伴随着网络交易数量的激增，各种安全问题也层出不穷，直接影响到网络交易快速稳定发展的步伐。为了改变这一状况，各种安全策略应运而生，相互配合为网络交易保驾护航。

在日常运营中，针对业务指标的感知是一个广泛的需求，当前根据风险需求，开发了一套基于时序检测的风险感知方案，该风险感知方案可以在时间轴上对时序数据做周期、趋势分解，针对去除周期、趋势后的数据，可以使用ESD算法检测数据点是否存在异常。而基于时序检测的风险感知方案往往都需要多天(如7天或10天等)的历史数据作为训练样本，在完成数据积累之前会出现一段空白的风险感知时段，在反作弊场景下，该空白的风险感知时段很可能会遭受黑产的攻击，造成大量资金损失。为此，需要提供一种能有效防止攻击的风险感知方案。

发明内容

本说明书实施例的目的是提供一种数据的处理方法、装置及设备，以提供一种能有效防止攻击的风险感知方案。

为了实现上述技术方案，本说明书实施例是这样实现的：

本说明书实施例提供的一种数据的处理方法，所述方法包括：

获取目标历史业务数据，并确定所述目标历史业务数据对应的风险属性信息和空间属性信息，所述目标历史业务数据包括预定的多个维度的数据；

基于所述目标历史业务数据对应的风险属性信息，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据；

基于所述目标历史业务数据对应的空间属性信息，以及所述目标历史业务数据中的异常业务数据和非异常业务数据，对所述异常业务数据进行异常空间检测，确定所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度；

根据所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度，确定存在风险的业务数据所包含的维度的信息。

可选地，所述方法还包括：

接收用户与商户的交易数据；

根据所述交易数据中包含的预定维度的数据，确定所述交易数据中是否包含存在风险的业务数据所包含的维度的信息；

如果所述交易数据中包含存在风险的业务数据所包含的维度的信息，则确定所述交易数据对应的交易存在风险。

可选地，所述方法还包括：

输出所述交易数据对应的交易存在风险的提示信息。

可选地，所述基于所述目标历史业务数据对应的风险属性信息，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据，包括：

基于所述目标历史业务数据对应的风险属性信息，通过以下中的至少一个算法：局部离群因子LOF检测算法、孤立森林IF检测算法、3Sigma准则，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据。

可选地，所述方法还包括：

分别对所述目标历史业务数据中的异常业务数据和非异常业务数据进行打标处理，以为所述目标历史业务数据中的异常业务数据和非异常业务数据设置相应的标签。

可选地，所述基于所述目标历史业务数据对应的空间属性信息，以及所述目标历史业务数据中的异常业务数据和非异常业务数据，对所述异常业务数据进行异常空间检测，确定所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度，包括：

根据所述目标历史业务数据中的异常业务数据和非异常业务数据，确定所述目标历史业务数据对应的空间属性信息的最优特征；

基于所述目标历史业务数据对应的空间属性信息的最优特征，将所述目标历史业务数据划分到多个子数据集中；

如果所述多个子数据集中存在只包含所述异常业务数据或所述非异常业务数据的第一子数据集，则将所述第一子数据集设置到预定树模型的叶子节点；

如果所述多个子数据集中存在包含所述异常业务数据和所述非异常业务数据的第二子数据集，则将所述第二子数据集设置到预定树模型的节点，并根据所述第二子数据集中的异常业务数据和非异常业务数据，确定所述第二子数据集对应的空间属性信息的最优特征，以对所述第二子数据集中的目标历史业务数据进行划分；

确定所述叶子节点中所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度。

可选地，所述根据所述目标历史业务数据中的异常业务数据和非异常业务数据，确定所述目标历史业务数据中的最优特征，包括：

根据所述目标历史业务数据中的异常业务数据和非异常业务数据，确定针对所述目标历史业务数据对应的空间属性信息的特征的信息增益；

根据针对所述目标历史业务数据对应的空间属性信息的特征的信息增益，确定所述目标历史业务数据对应的空间属性信息的最优特征。

可选地，所述风险属性信息为能够描述所述目标历史业务数据是否存在风险，或者所述风险属性信息对应的属性值的变化被关注，所述空间属性信息为除了所述风险属性信息之外，能够将业务数据划分成不同子数据集的属性信息。

本说明书实施例提供的一种数据的处理装置，所述装置包括：

数据获取模块，用于获取目标历史业务数据，并确定所述目标历史业务数据对应的风险属性信息和空间属性信息，所述目标历史业务数据包括预定的多个维度的数据；

异常检测模块，用于基于所述目标历史业务数据对应的风险属性信息，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据；

空间检测模块，用于基于所述目标历史业务数据对应的空间属性信息，以及所述目标历史业务数据中的异常业务数据和非异常业务数据，对所述异常业务数据进行异常空间检测，确定所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度；

风险确定模块，用于根据所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度，确定存在风险的业务数据所包含的维度的信息。

可选地，所述装置还包括：

数据接收模块，用于接收用户与商户的交易数据；

数据确定模块，用于根据所述交易数据中包含的预定维度的数据，确定所述交易数据中是否包含存在风险的业务数据所包含的维度的信息；

风险确定模块，用于如果所述交易数据中包含存在风险的业务数据所包含的维度的信息，则确定所述交易数据对应的交易存在风险。

可选地，所述异常检测模块，用于基于所述目标历史业务数据对应的风险属性信息，通过以下中的至少一个算法：局部离群因子LOF检测算法、孤立森林IF检测算法、3Sigma准则，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据。

可选地，所述空间检测模块，包括：

最优特征确定单元，用于根据所述目标历史业务数据中的异常业务数据和非异常业务数据，确定所述目标历史业务数据对应的空间属性信息的最优特征；

数据划分单元，用于基于所述目标历史业务数据对应的空间属性信息的最优特征，将所述目标历史业务数据划分到多个子数据集中；

设置单元，用于如果所述多个子数据集中存在只包含所述异常业务数据或所述非异常业务数据的第一子数据集，则将所述第一子数据集设置到预定树模型的叶子节点；

处理单元，用于如果所述多个子数据集中存在包含所述异常业务数据和所述非异常业务数据的第二子数据集，则将所述第二子数据集设置到预定树模型的节点，并根据所述第二子数据集中的异常业务数据和非异常业务数据，确定所述第二子数据集对应的空间属性信息的最优特征，以对所述第二子数据集中的目标历史业务数据进行划分；

空间检测单元，用于确定所述叶子节点中所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度。

可选地，所述最优特征确定单元，用于根据所述目标历史业务数据中的异常业务数据和非异常业务数据，确定针对所述目标历史业务数据对应的空间属性信息的特征的信息增益；根据针对所述目标历史业务数据对应的空间属性信息的特征的信息增益，确定所述目标历史业务数据对应的空间属性信息的最优特征。

本说明书实施例提供的一种数据的处理设备，所述数据的处理设备包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器：

由以上本说明书实施例提供的技术方案可见，本说明书实施例通过获取目标历史业务数据，并确定目标历史业务数据对应的风险属性信息和空间属性信息，目标历史业务数据包括预定的多个维度的数据，基于目标历史业务数据对应的风险属性信息，对目标历史业务数据进行异常检测，确定目标历史业务数据中的异常业务数据和非异常业务数据，基于目标历史业务数据对应的空间属性信息，以及目标历史业务数据中的异常业务数据和非异常业务数据，对异常业务数据进行异常空间检测，确定异常业务数据在多个维度中的一个或多个维度上聚集的程度，根据异常业务数据在多个维度中的一个或多个维度上聚集的程度，确定存在风险的业务数据所包含的维度的信息，这样，通过空间数据的感知，不依赖与时序数据，可以在活动或业务等的初始阶段就能感知数据是否存在异常，从而解决了在活动或业务等的初始阶段中累计数据时的检测空白问题，能够有效防止风险的发生，而且，使用无监督异常检测机制和异常空间检测机制确定业务数据中存在的异常，使得风险检测更加准确，减少误报的产生。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书一种数据的处理方法实施例；

图2为本说明书另一种数据的处理方法实施例；

图3为本说明书一种树模型的结构示意图；

图4为本说明书一种业务数据的处理系统的结构示意图；

图5为本说明书一种数据的处理装置实施例；

图6为本说明书一种数据的处理设备实施例。

具体实施方式

本说明书实施例提供一种数据的处理方法、装置及设备。

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

实施例一

如图1所示，本说明书实施例提供一种数据的处理方法，该方法的执行主体可以为服务器，其中，该服务器可以是一个独立的服务器，还可以是由多个服务器构成的服务器集群等。该服务器可以是某项业务(如进行交易的业务等)的后台服务器，也可以是某应用(如金融类应用层)的后台服务器等。该方法可以用于在业务或某活动上线初期以感知某业务数据或活动是否有风险异常等处理中。该方法具体可以包括以下步骤：

在步骤S102中，获取目标历史业务数据，并确定目标历史业务数据对应的风险属性信息和空间属性信息，目标历史业务数据包括预定的多个维度的数据。

其中，目标历史业务数据可以是某业务场景下的相关历史数据，或多个不同业务场景下的相关历史数据等，目标历史业务数据可以包括多种不同维度的数据，例如，目标历史业务数据可以是某项交易的相关数据，具体如用户的信息(如用户的账户信息、用户的性别信息、年龄、职业信息等)、商户的信息(如商户的账户信息、商户所处的地理位置等)和该项交易的交易数据等。风险属性信息可以是能够判定某业务数据是否存在风险的属性的信息，例如用户使用的设备是否是存在风险的设备、商户使用的设备是否是存在风险的设备、是否满额核销营销资金等。空间属性信息可以是除了上述风险属性信息之外，能够将业务数据划分成不同集合的属性的信息，例如，地理位置信息、区域信息、用户认证类型信息等。多个维度可以根据实际情况预先设定，多个维度可以包括如姓名维度、性别维度、年龄范围维度、时间段维度、地理位置维度等。

在实施中，随着互联网技术的飞速发展，网络交易这种全新的交易模式已经被越来越多的人所接受，并且逐渐成为人们消费的重要渠道，改变着人们的生活。然而，伴随着网络交易数量的激增，各种安全问题也层出不穷，直接影响到网络交易快速稳定发展的步伐。为了改变这一状况，各种安全策略应运而生，相互配合为网络交易保驾护航。

通常，金融业务中网络交易的反作弊机制可分为感知、识别和管控三大部分，其中，感知部分主要是通过监控各个业务指标的波动，进而了解业务状况，发现可能存在的风险。识别部分主要是从过去出现的风险里，通过预定的模型去学习出现的风险模式，并在新的数据上预测是否存在类似的风险。管控部分是针对上述识别的结果进行差异化的管理。然而，在反作弊场景下，黑产作弊隐蔽而且迅速，往往在黑产作弊时很难通过上述识别的方法去发现相应的问题，但是，黑产的批量攻击行为会造成相关业务指标出现短时波动，可以通过感知部分的相应机制捕捉黑产攻击。

在日常运营中，针对业务指标的感知是一个广泛的需求，当前根据风险需求，开发了一套基于时序检测的风险感知方案，并融于某金融业务的相关服务中。该风险感知方案可以在时间轴上对时序数据做周期、趋势分解，针对去除周期、趋势后的数据，可以使用ESD算法检测数据点是否存在异常。而基于时序检测的风险感知方案往往都需要多天(如7天或10天等)的历史数据作为训练样本，在完成数据积累之前会出现一段空白的风险感知时段，在反作弊场景下，该空白的风险感知时段很可能会遭受黑产的攻击，造成大量资金损失。

为此，还提供了另一种风险感知方案，即可以通过专家经验等，为相应的业务指标设定一个阈值，当该业务指标超过该阈值时，可以认为该业务指标对应的风险发生了一次。该风险感知方案简单而且不依赖时序数据，可以在业务的初始阶段进行风险感知处理，但是由于通过人工经验制定相应的规则，需要人们对业务具备较深入的理解，当需要添加新的业务信息时，很难给出有效的规则来感知数据是否发生异常，而且指定的规则往往较简单，在该业务的初始阶段，某些业务指标的波动可能比较大，因此，很容易产生很多误报。

为了解决上述出现的问题，本说明书实施例提供一种误报更少、有效防止攻击的风险感知方案，具体可以包括以下内容：

用户在使用某应用程序时，该应用程序可以向后台服务器请求相应的服务数据，此时，服务器可以记录用户的相关信息和该用户请求的服务数据等，同时，服务器还可以记录其它相关业务数据，例如，用户通过金融类应用程序向另一个用户转账，则用户可以启动该金融类应用程序，并可以通过用户名和密码登录到相应的金融系统，然后，可以通过该金融类应用程序中提供的转账功能，发起向另一个用户的转账请求，该转账请求中可以包括转账的金额、该用户的账户信息、另一个用户的账户信息等，服务器可以记录上述业务数据。当需要对某业务数据进行风险检测之前，可以获取上述记录的历史业务数据(即目标历史业务数据)，其中获取的目标历史业务数据可以是指定时间段(如当前时刻之前7天等)内的数据，也可以是当前时刻之前的所有数据等，具体可以根据实际情况设定，本说明书实施例对此不做限定。

可以将上述获取的目标历史业务数据作为数据源，该目标历史业务数据中可以包括如用户与商户的历史交易信息、用户的身份标签、商户的身份标签等。此外，为了方便管理数据源中的数据，可以设置多个维度，可以将数据源中的数据分别设置到相应的维度中，例如，设置的维度包括性别维度、年龄范围维度和时间段维度，则可以将数据源中与性别相关的信息设置到性别维度下，将数据源中与年龄相关的信息设置到年龄范围维度下，将数据源中与时间相关的信息设置到时间段维度下等。

另外，由于数据源中包括获取的各种各样的历史业务数据，为了便于后续处理方便，可以对数据源中的目标历史业务数据进行属性分析，可以根据业务场景，将目标历史业务数据中包含的数据划分到两个属性中，即风险属性和空间属性，从而得到目标历史业务数据对应的风险属性信息和空间属性信息。

在步骤S104中，基于目标历史业务数据对应的风险属性信息，对目标历史业务数据进行异常检测，确定目标历史业务数据中的异常业务数据和非异常业务数据。

在实施中，由于风险属性信息是能够描述某历史业务数据是否存在风险的信息，因此，可以通过目标历史业务数据对应的风险属性信息，对目标历史业务数据进行分析，确定相应的目标历史业务数据是否为异常业务数据，如果某目标历史业务数据为异常业务数据，则可以对该目标历史业务数据进行标记，以表明该目标历史业务数据为异常业务数据，如果某目标历史业务数据为非异常业务数据(或正常业务数据)，则可以不需要对该目标历史业务数据做任何标记。

例如，某目标历史业务数据中记录有用户的账户信息、用户使用的设备的相关信息(如该设备的标识(如MAC地址等)或IP地址等)、商户的账户信息、商户使用的设备的相关信息(如该设备的标识(如MAC地址等)或IP地址等)和用户向商户支付的金额等，通过属性分析，可以确定该目标历史业务数据对应的风险属性信息可以为商户使用的设备为风险设备(可以通过历史数据判定该设备是否为风险设备，其中的历史数据可以是该商户使用的设备曾多次被用户举报为欺诈设备等)，此时，可以确定相应的目标历史业务数据为异常业务数据，可以对该目标历史业务数据进行标记。

在步骤S106中，基于目标历史业务数据对应的空间属性信息，以及目标历史业务数据中的异常业务数据和非异常业务数据，对该异常业务数据进行异常空间检测，确定该异常业务数据在多个维度中的一个或多个维度上聚集的程度。

其中，异常业务数据在某个维度上聚集的程度可以是异常业务数据在该维度上出现的次数与异常业务数据的总量的比值等。

在实施中，可以预先设定进行异常空间检测的模型或算法，该模型或算法可以确定异常业务数据在多个维度中的一个或多个维度上聚集的程度，对于模型，可以通过多种方式获取相应的样本数据，通过该样本数据可以对该模型进行训练，得到训练后的模型。该模型或算法可以包括多种，具体可以根据实际情况设定，本说明书实施例对此不做限定。

可以将目标历史业务数据对应的空间属性信息作为变量，将对目标历史业务数据进行异常检测的结果(即确定的异常业务数据和非异常业务数据)作为标签，可以将上述变量和标签输入到训练后的模型或预先设定的算法中进行计算，以对目标历史业务数据进行异常空间检测，得到该异常业务数据在多个维度中的一个或多个维度上聚集的程度。

在步骤S108中，根据上述异常业务数据在多个维度中的一个或多个维度上聚集的程度，确定存在风险的业务数据所包含的维度的信息。

在实施中，可以预先设定异常业务数据在多个维度中的每个维度上聚集的程度的阈值，通过上述步骤S106的处理得到异常业务数据在多个维度中的一个或多个维度上聚集的程度后，可以将得到的异常业务数据在多个维度中的某个维度上聚集的程度与相应的阈值进行比较，如果得到的程度的数值大于相应的阈值，则表明该维度出现在异常业务数据中的概率较大，此时，可以将该维度确定为存在风险的业务数据所包含的维度，如果得到的程度的数值小于相应的阈值，则表明该维度出现在异常业务数据中的概率较小，此时，可以放弃该维度，通过上述方式可以确定存在风险的业务数据所包含的维度的信息，其中，存在风险的业务数据所包含的维度的信息具体可以包括如用户年龄范围在大于60岁、时间段在23:00-4:00、交易金额大于5000元等，也即是满足用户的年龄范围在大于60岁、时间段在23:00-4:00、交易金额大于5000元的交易为存在风险的交易。

本说明书实施例提供一种数据的处理方法，通过获取目标历史业务数据，并确定目标历史业务数据对应的风险属性信息和空间属性信息，目标历史业务数据包括预定的多个维度的数据，基于目标历史业务数据对应的风险属性信息，对目标历史业务数据进行异常检测，确定目标历史业务数据中的异常业务数据和非异常业务数据，基于目标历史业务数据对应的空间属性信息，以及目标历史业务数据中的异常业务数据和非异常业务数据，对异常业务数据进行异常空间检测，确定异常业务数据在多个维度中的一个或多个维度上聚集的程度，根据异常业务数据在多个维度中的一个或多个维度上聚集的程度，确定存在风险的业务数据所包含的维度的信息，这样，通过空间数据的感知，不依赖与时序数据，可以在活动或业务等的初始阶段就能感知数据是否存在异常，从而解决了在活动或业务等的初始阶段中累计数据时的检测空白问题，能够有效防止风险的发生，而且，使用无监督异常检测机制和异常空间检测机制确定业务数据中存在的异常，使得风险检测更加准确，减少误报的产生。

实施例二

如图2所示，本说明书实施例提供一种数据的处理方法，该方法的执行主体可以为服务器，其中，该服务器可以是一个独立的服务器，还可以是由多个服务器构成的服务器集群等。该服务器可以是某项业务(如进行交易的业务等)的后台服务器，也可以是某应用(如金融类应用层)的后台服务器等。该方法可以用于在业务或某活动上线初期以感知某业务数据或活动是否有风险异常等处理中。该方法具体可以包括以下步骤：

在步骤S202中，获取目标历史业务数据，并确定目标历史业务数据对应的风险属性信息和空间属性信息，目标历史业务数据包括预定的多个维度的数据。

其中，风险属性信息为能够描述目标历史业务数据是否存在风险，或者风险属性信息对应的属性值的变化被关注，空间属性信息为除了风险属性信息之外，能够将业务数据划分成不同子数据集的属性信息。其中的风险属性信息对应的属性值的变化被关注可以是风险属性信息对应的属性值的变化值得被关注，即关注风险属性信息对应的属性值的变化可以直接或间接确定某些有用信息等。

上述步骤S202的处理完成后，可以执行上述实施例一种步骤S104的处理，在实际应用中，上述步骤S104的处理可以多种多样，以下提供一种可选的处理方式，具体可以包括以下步骤S204的处理。

在步骤S204中，基于目标历史业务数据对应的风险属性信息，通过以下中的至少一个算法：局部离群因子LOF检测算法、孤立森林IF检测算法、3Sigma准则，对目标历史业务数据进行异常检测，确定目标历史业务数据中的异常业务数据和非异常业务数据。

在实施中，可以通过多种算法对目标历史业务数据进行异常检测，例如LOF(LocalOutlier Factor，局部离群因子)检测算法、IF(Isolation Forest，孤立森林)检测算法或3Sigma准则等，以LOF检测算法为例，上述步骤S204的具体处理过程可以包括：

LOF检测算法可以是基于密度的算法，LOF检测算法对数据分布没有过多要求，并能够给出每条目标历史业务数据的异常度分值。在LOF检测算法中，d(p,o)表示点p到点o之间的距离，K-邻近距离即在距离点p较近的多个点中，第K个点与点p之间的距离，可以记为d_k(p)。点p到点o的可达距离可以为点o的K-邻近距离和点p到点o的直接距离的最大值，即Max{d_k(o)，d(p,o)}。针对局部可达密度，对于点p来说，到点p之间的距离小于或等于d_k(p)的点称为点p的K-邻近，可以记为N_k(p)，则点p的局部密度可达为与邻近点的平均可达距离的倒数，即

局部异常因子即根据局部可达密度的定义，如果一个点跟其他点离的比较远，则该点的局部可达密度很小。但是，LOF检测算法并不是只看数据点的绝对局部密度，而是看它与周围点的相对密度，即数据点的相对密度(局部异常因子)定义为

根据局部异常因子的定义，如果点p得到的异常度分值在1附近，则表明点p的局部可达密度和点p的邻近点相差不大，如果点p得到的异常度分值小于1，则表明点p的局部可达密度比点p的邻近点更大，如果点p得到的异常度分值远大于1，则表明点p与点p的邻近点比较疏远，即点p更可能是异常点。需要说明的是，本说明书实施例中，上述提到的点p、点o，以及相应的邻近点中的每一个点可以表征一条目标历史业务数据，由于每条目标历史业务数据可以包含一个或多个风险属性信息，而每个风险属性信息可以由相应的特征对应的向量表示，因此，一条目标历史业务数据可以使用其包含的风险属性信息中的特征对应的向量表征，即上述提到的点p、点o，以及相应的邻近点中的每一个点可以是表征相应目标历史业务数据对应的向量的点。

通过LOF检测算法可以得到每条目标历史业务数据对应的异常分值，可以预先设定异常阈值，该异常阈值可以通过相应的业务经验确定，当某一条目标历史业务数据对应的异常分值大于该异常阈值时，将该条目标历史业务数据判断为异常业务数据，否则，该条目标历史业务数据为非异常业务数据。

需要说明的是，上述仅是以LOF检测算法为例进行的说明，在实际应用中，上述处理并不限于通过LOF检测算法实现，还可以通过其它算法实现，具体可以依据相应算法的处理过程进行，本说明书实施例在此不再赘述。

在步骤S206中，分别对目标历史业务数据中的异常业务数据和非异常业务数据进行打标处理，以为目标历史业务数据中的异常业务数据和非异常业务数据设置相应的标签。

在实施中，为了方便后续处理过程，通过上述处理确定目标历史业务数据中包含的异常业务数据和非异常业务数据后，可以分别对每个目标历史业务数据进行打标处理，可以为目标历史业务数据中的异常业务数据设置相应的标签，并可以为目标历史业务数据中的非异常业务数据设置相应的标签，例如可以为异常业务数据设置标签“1”，为非异常业务数据设置标签“0”等，通过设置的标签可以直观的确定当前的目标历史业务数据是否为异常业务数据。

上述步骤S206的处理完成后，可以执行上述实施例一种步骤S106的处理，在实际应用中，上述步骤S106的处理可以多种多样，以下提供一种可选的处理方式，具体可以包括以下步骤S208～步骤S216的处理。

在步骤S208中，根据目标历史业务数据中的异常业务数据和非异常业务数据，确定目标历史业务数据对应的空间属性信息的最优特征。

在实施中，异常空间检测的处理可以是利用空间属性信息作为变量，上述异常检测的结果作为标签，通过预定模型检测异常业务数据是否在空间(即一个或多个不同维度)上存在聚集，由于目标历史业务数据包含的数据的维度较多，为了方便后续处理，可以将目标历史业务数据划分到多个子数据集中，为此，可以通过选取一项最优特征来对目标历史业务数据进行划分，具体地，可以预先获取目标历史业务数据对应的特征，根据目标历史业务数据中的异常业务数据和非异常业务数据，可以确定异常业务数据和非异常业务数据中包含的各个特征的比例，可以将比例最大的特征作为目标历史业务数据对应的空间属性信息的最优特征。

在实际应用中，上述步骤S208的处理可以多种多样，以下提供一种可选的处理方式，具体可以参见下述步骤一和步骤二。

步骤一，根据目标历史业务数据中的异常业务数据和非异常业务数据，确定针对目标历史业务数据对应的空间属性信息的特征的信息增益。

在实施中，异常空间检测中关键的部分是每个节点选择的用来划分目标历史业务数据的特征，可以采用信息增益最大的特征，即可以通过信息熵和条件熵的方式确定相应特征的信息增益。信息熵可以度量事物的不确定性，越混乱的事物，其对应的熵越大，信息量越大，也即是如果目标历史业务数据中异常业务数据越混乱，熵越大，如果目标历史业务数据中只有异常业务数据，则相应的信息熵最小，信息熵最小。信息熵的定义如下：

info(D)＝-∑p_i*log(p_i) (3)

其中，p_i表示目标历史业务数据中标签为i的比率，D表示目标历史业务数据等。

通过上述公式(3)可以确定标签为“1”的异常业务数据的信息熵，以及标签为“0”的非异常业务数据的信息熵等。

特征对应的条件熵可以是选择某项特征之后的信息熵，如下：

其中，info_A(D)表示特征A的条件熵，|D_j|表示维度信息或属性信息等为j的目标历史业务数据的数量(具体如维度信息为男的目标历史业务数据的数量等)，|D|表示目标历史业务数据的总数量。

通过上述公式(4)可以确定每一项特征对应的条件熵，基于每一项特征对应的条件熵，可以进一步确定每一项特征的信息增益，具体可以参见下述内容：

g(D,A)＝info(D)-info_A(D) (5)

其中，g(D,A)表示特征A的信息增益。

步骤二，根据针对目标历史业务数据对应的空间属性信息的特征的信息增益，确定目标历史业务数据对应的空间属性信息的最优特征。

在实施中，可以比较每一项特征的信息增益的数值，从中可以确定信息增益的数值最大的特征，可以将确定的特征作为目标历史业务数据对应的空间属性信息的最优特征。

在步骤S210中，基于目标历史业务数据对应的空间属性信息的最优特征，将目标历史业务数据划分到多个子数据集中。

其中，多个子数据集可以是2个子数据集或3个子数据集，或者更多个子数据集等，本说明书实施例对此不做限定。

在步骤S212中，如果多个子数据集中存在只包含异常业务数据或非异常业务数据的第一子数据集，则将第一子数据集设置到预定树模型的叶子节点。

在实施中，为了后续处理更加直观、简化，可以将预定模型设定为树模型，如图3所示，树模型中可以包括根节点、中间节点和叶子节点。可以构建树模型的根节点，并将目标历史业务数据放在根节点中，基于上述选取的目标历史业务数据对应的空间属性信息的最优特征，将根节点中的目标历史业务数据的集合分割成子数据集。如果多个子数据集中存在只包含异常业务数据或非异常业务数据的第一子数据集，则构建叶子节点，并将第一子数据集划分到对应的叶子节点上，输出该叶子节点的路径。

在步骤S214中，如果多个子数据集中存在包含异常业务数据和非异常业务数据的第二子数据集，则将第二子数据集设置到预定树模型的节点，并根据第二子数据集中的异常业务数据和非异常业务数据，确定第二子数据集对应的空间属性信息的最优特征，以对第二子数据集中的目标历史业务数据进行划分。

在实施中，如果多个子数据集中存在包含异常业务数据和非异常业务数据的第二子数据集，则将第二子数据集设置到预定树模型的节点(即中间节点)，然后，根据第二子数据集中的异常业务数据和非异常业务数据，确定第二子数据集对应的空间属性信息的最优特征，具体可以参见上述步骤S208中的相关内容，在此不再赘述。基于第二子数据集对应的空间属性信息的最优特征，将第二子数据集划分到多个子数据集中，之后可以执行上述步骤S212或步骤S214的处理，直到所有的叶子节点中都只有异常业务数据或者非异常业务数据，或者待划分的目标历史业务数据的数据量过小时，停止对目标历史业务数据的划分。

通过上述树模型，可以得到异常业务数据聚集的路径，而得到的路径即为上述的异常空间，既可以是一个或多个维度的维度信息等。

在步骤S216中，确定叶子节点中异常业务数据在多个维度中的一个或多个维度上聚集的程度。

在步骤S218中，根据异常业务数据在多个维度中的一个或多个维度上聚集的程度，确定存在风险的业务数据所包含的维度的信息。

通过上述步骤S202～步骤S218的处理，得到存在风险的业务数据所包含的维度的信息后，可以基于该维度的信息对业务数据进行异常检测，上述处理方案可以应用于系统或活动上线的初期等。对于业务数据为用户与商户的交易数据的具体情况，可以通过下述步骤S220～步骤S226的处理实现业务数据的风险检测。

在步骤S220中，接收用户与商户的交易数据。

在实施中，如图4所示，用户可以通过支付应用或金融应用向某商户发起某项交易(例如用户向商户进行支付或用户向商户转账等)，此时，服务器可以获取用户与商户的交易数据，其中可以包括用户历史交易信息、商户的历史交易信息，以及用户的身份信息和商户的身份信息等，在实际应用中，交易数据中不仅仅包含上述信息或数据，还可以包括其它多个维度的信息，本说明书实施例对此不做限定。

在步骤S222中，根据上述交易数据中包含的预定维度的数据，确定该交易数据中是否包含存在风险的业务数据所包含的维度的信息。

在实施中，可以对上述交易数据中包含的数据对应的维度进行分析，确定该交易数据对应的维度，以及该维度对应的维度的信息，然后，可以在该交易数据对应的维度，以及该维度对应的维度的信息中，查找其中是否存在风险的业务数据所包含的维度的信息。

在步骤S224中，如果上述交易数据中包含存在风险的业务数据所包含的维度的信息，则确定该交易数据对应的交易存在风险。

在步骤S226中，输出上述交易数据对应的交易存在风险的提示信息。

在实施中，可以以弹出窗口的方式，输出上述交易数据对应的交易存在风险的提示信息，或者，可以通过向相应的管理人员发送相应信息(如邮件或短消息等)的方式，输出上述交易数据对应的交易存在风险的提示信息，或者，可以通过相应指示灯闪烁的方式，输出上述交易数据对应的交易存在风险的提示信息等，具体可以根据实际情况设定，本说明书实施例对此不做限定。

实施例三

以上为本说明书实施例提供的数据的处理方法，基于同样的思路，本说明书实施例还提供一种数据的处理装置，如图5所示。

该数据的处理装置包括：数据获取模块501、异常检测模块502、空间检测模块503和风险确定模块504，其中：

数据获取模块501，用于获取目标历史业务数据，并确定所述目标历史业务数据对应的风险属性信息和空间属性信息，所述目标历史业务数据包括预定的多个维度的数据；

异常检测模块502，用于基于所述目标历史业务数据对应的风险属性信息，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据；

空间检测模块503，用于基于所述目标历史业务数据对应的空间属性信息，以及所述目标历史业务数据中的异常业务数据和非异常业务数据，对所述异常业务数据进行异常空间检测，确定所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度；

风险确定模块504，用于根据所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度，确定存在风险的业务数据所包含的维度的信息。

本说明书实施例中，所述装置还包括：

数据接收模块，用于接收用户与商户的交易数据；

本说明书实施例中，所述装置还包括：

提示模块，用于输出所述交易数据对应的交易存在风险的提示信息。

本说明书实施例中，所述异常检测模块502，用于基于所述目标历史业务数据对应的风险属性信息，通过以下中的至少一个算法：局部离群因子LOF检测算法、孤立森林IF检测算法、3Sigma准则，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据。

本说明书实施例中，所述装置还包括：

打标模块，用于分别对所述目标历史业务数据中的异常业务数据和非异常业务数据进行打标处理，以为所述目标历史业务数据中的异常业务数据和非异常业务数据设置相应的标签。

本说明书实施例中，所述空间检测模块503，包括：

本说明书实施例中，所述最优特征确定单元，用于根据所述目标历史业务数据中的异常业务数据和非异常业务数据，确定针对所述目标历史业务数据对应的空间属性信息的特征的信息增益；根据针对所述目标历史业务数据对应的空间属性信息的特征的信息增益，确定所述目标历史业务数据对应的空间属性信息的最优特征。

本说明书实施例中，所述风险属性信息为能够描述所述目标历史业务数据是否存在风险，或者所述风险属性信息对应的属性值的变化被关注，所述空间属性信息为除了所述风险属性信息之外，能够将业务数据划分成不同子数据集的属性信息。

本说明书实施例提供一种数据的处理装置，通过获取目标历史业务数据，并确定目标历史业务数据对应的风险属性信息和空间属性信息，目标历史业务数据包括预定的多个维度的数据，基于目标历史业务数据对应的风险属性信息，对目标历史业务数据进行异常检测，确定目标历史业务数据中的异常业务数据和非异常业务数据，基于目标历史业务数据对应的空间属性信息，以及目标历史业务数据中的异常业务数据和非异常业务数据，对异常业务数据进行异常空间检测，确定异常业务数据在多个维度中的一个或多个维度上聚集的程度，根据异常业务数据在多个维度中的一个或多个维度上聚集的程度，确定存在风险的业务数据所包含的维度的信息，这样，通过空间数据的感知，不依赖与时序数据，可以在活动或业务等的初始阶段就能感知数据是否存在异常，从而解决了在活动或业务等的初始阶段中累计数据时的检测空白问题，能够有效防止风险的发生，而且，使用无监督异常检测机制和异常空间检测机制确定业务数据中存在的异常，使得风险检测更加准确，减少误报的产生。

实施例四

以上为本说明书实施例提供的数据的处理装置，基于同样的思路，本说明书实施例还提供一种数据的处理设备，如图6所示。

所述数据的处理设备可以为上述实施例提供的服务器。

数据的处理设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器601和存储器602，存储器602中可以存储有一个或一个以上存储应用程序或数据。其中，存储器602可以是短暂存储或持久存储。存储在存储器602的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括对数据的处理设备中的一系列计算机可执行指令。更进一步地，处理器601可以设置为与存储器602通信，在数据的处理设备上执行存储器602中的一系列计算机可执行指令。数据的处理设备还可以包括一个或一个以上电源603，一个或一个以上有线或无线网络接口604，一个或一个以上输入输出接口605，一个或一个以上键盘606。

具体在本实施例中，数据的处理设备包括有存储器，以及一个或一个以上的程序，其中一个或者一个以上程序存储于存储器中，且一个或者一个以上程序可以包括一个或一个以上模块，且每个模块可以包括对数据的处理设备中的一系列计算机可执行指令，且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令：

本说明书实施例中，还包括：

接收用户与商户的交易数据；

本说明书实施例中，还包括：

输出所述交易数据对应的交易存在风险的提示信息。

本说明书实施例中，所述基于所述目标历史业务数据对应的风险属性信息，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据，包括：

本说明书实施例中，还包括：

本说明书实施例中，所述基于所述目标历史业务数据对应的空间属性信息，以及所述目标历史业务数据中的异常业务数据和非异常业务数据，对所述异常业务数据进行异常空间检测，确定所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度，包括：

本说明书实施例中，所述根据所述目标历史业务数据中的异常业务数据和非异常业务数据，确定所述目标历史业务数据中的最优特征，包括：

本说明书实施例提供一种数据的处理设备，通过获取目标历史业务数据，并确定目标历史业务数据对应的风险属性信息和空间属性信息，目标历史业务数据包括预定的多个维度的数据，基于目标历史业务数据对应的风险属性信息，对目标历史业务数据进行异常检测，确定目标历史业务数据中的异常业务数据和非异常业务数据，基于目标历史业务数据对应的空间属性信息，以及目标历史业务数据中的异常业务数据和非异常业务数据，对异常业务数据进行异常空间检测，确定异常业务数据在多个维度中的一个或多个维度上聚集的程度，根据异常业务数据在多个维度中的一个或多个维度上聚集的程度，确定存在风险的业务数据所包含的维度的信息，这样，通过空间数据的感知，不依赖与时序数据，可以在活动或业务等的初始阶段就能感知数据是否存在异常，从而解决了在活动或业务等的初始阶段中累计数据时的检测空白问题，能够有效防止风险的发生，而且，使用无监督异常检测机制和异常空间检测机制确定业务数据中存在的异常，使得风险检测更加准确，减少误报的产生。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device，PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书的实施例可提供为方法、系统、或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据的处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据的处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据的处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据的处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种数据的处理方法，所述方法包括：

2.根据权利要求1所述的方法，所述方法还包括：

接收用户与商户的交易数据；

3.根据权利要求2所述的方法，所述方法还包括：

输出所述交易数据对应的交易存在风险的提示信息。

4.根据权利要求1所述的方法，所述基于所述目标历史业务数据对应的风险属性信息，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据，包括：

基于所述目标历史业务数据对应的风险属性信息，通过以下中的至少一个算法：局部离群因子LOF检测算法、孤立森林IF检测算法、3 Sigma准则，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据。

5.根据权利要求4所述的方法，所述方法还包括：

6.根据权利要求1所述的方法，所述基于所述目标历史业务数据对应的空间属性信息，以及所述目标历史业务数据中的异常业务数据和非异常业务数据，对所述异常业务数据进行异常空间检测，确定所述异常业务数据在所述多个维度中的一个或多个维度上聚集的程度，包括：

7.根据权利要求6所述的方法，所述根据所述目标历史业务数据中的异常业务数据和非异常业务数据，确定所述目标历史业务数据中的最优特征，包括：

8.根据权利要求6所述的方法，所述风险属性信息为能够描述所述目标历史业务数据是否存在风险，或者所述风险属性信息对应的属性值的变化被关注，所述空间属性信息为除了所述风险属性信息之外，能够将业务数据划分成不同子数据集的属性信息。

9.一种数据的处理装置，所述装置包括：

10.根据权利要求9所述的装置，所述装置还包括：

数据接收模块，用于接收用户与商户的交易数据；

11.根据权利要求9所述的装置，所述异常检测模块，用于基于所述目标历史业务数据对应的风险属性信息，通过以下中的至少一个算法：局部离群因子LOF检测算法、孤立森林IF检测算法、3 Sigma准则，对所述目标历史业务数据进行异常检测，确定所述目标历史业务数据中的异常业务数据和非异常业务数据。

12.根据权利要求9所述的装置，所述空间检测模块，包括：

13.根据权利要求12所述的装置，所述最优特征确定单元，用于根据所述目标历史业务数据中的异常业务数据和非异常业务数据，确定针对所述目标历史业务数据对应的空间属性信息的特征的信息增益；根据针对所述目标历史业务数据对应的空间属性信息的特征的信息增益，确定所述目标历史业务数据对应的空间属性信息的最优特征。

14.一种数据的处理设备，所述数据的处理设备包括：

处理器；以及