CN115131023A

CN115131023A - 一种数据处理方法、装置、服务器以及存储介质

Info

Publication number: CN115131023A
Application number: CN202110317012.7A
Authority: CN
Inventors: 吴杰
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-03-24
Filing date: 2021-03-24
Publication date: 2022-09-30

Abstract

本申请实施例公开了一种数据处理方法、装置、服务器以及存储介质，其中方法包括：确定目标对象和样本对象集合，样本对象集合包括一个或多个样本对象，样本对象集合中所有样本对象对应M个风险类别；从样本对象集合中确定风险类别为目标风险类别的N个样本对象；获取N个样本对象中每一个样本对象在目标风险类别上的风险权重，以及确定目标对象与每一个样本对象之间的关联强度；根据每一个样本对象在目标风险类别上的风险权重，以及目标对象与每一个样本对象之间的关联强度确定目标对象在目标风险类别上的风险权重；根据目标对象在目标风险类别上的风险权重确定目标对象的风险信息。可以准确的获得对象的风险信息，从而提高风险类别的识别精度。

Description

一种数据处理方法、装置、服务器以及存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种数据处理方法、装置、服务器以及存储介质。

背景技术

随着计算机技术可互联网技术的快速发展，网络交易在人们的日常生活中的应用越来越广泛，也给人们在日常生活中带来了极大的便利。但是，在网络交易中，交易账户可能存在各种风险，例如，诈骗、套现等风险。

目前，确定不同交易账户的风险信息的方法通常是通过该交易账户的风险特征来判断风险类别，例如，风险特征可以是是金额、交易对手、交易区域、资金模式等特征。而上述确定风险信息的方法可能会存在以下问题：针对交易账户对应的风险特征很少甚至没有时，那么利用上述方法就无法准确得到不同交易账户的风险信息。因此，如何高效且准确的得到不同账户的风险信息是一个亟需解决的问题。

发明内容

本申请实施例提供了一种数据处理方法、装置、服务器以及存储介质，可以准确的获得对象的风险信息，并利用风险信息确定对象的风险类别，从而可以有效的提高风险类别的识别精度。

本申请实施例第一方面公开了一种数据处理方法，所述方法包括：

确定目标对象和样本对象集合，所述样本对象集合包括一个或多个样本对象，所述样本对象集合中的所有样本对象对应M个风险类别；

从所述样本对象集合中确定风险类别为目标风险类别的N个样本对象，所述目标风险类别为所述M个风险类别中的任一种；

获取所述N个样本对象中每一个样本对象在所述目标风险类别上的风险权重，以及确定所述目标对象与所述每一个样本对象之间的关联强度；

根据所述每一个样本对象在所述目标风险类别上的风险权重，以及所述目标对象与所述每一个样本对象之间的关联强度确定所述目标对象在所述目标风险类别上的风险权重；

根据所述目标对象在所述目标风险类别上的风险权重确定所述目标对象的风险信息。

本申请实施例第二方面公开了一种数据处理装置，所述装置包括：

确定单元，用于确定目标对象和样本对象集合，所述样本对象集合包括一个或多个样本对象，所述样本对象集合中的所有样本对象对应M个风险类别；

所述确定单元，还用于从所述样本对象集合中确定风险类别为目标风险类别的N个样本对象，所述目标风险类别为所述M个风险类别中的任一种；

获取单元，用于获取所述N个样本对象中每一个样本对象在所述目标风险类别上的风险权重，以及确定所述目标对象与所述每一个样本对象之间的关联强度；

所述确定单元，还用于根据所述每一个样本对象在所述目标风险类别上的风险权重，以及所述目标对象与所述每一个样本对象之间的关联强度确定所述目标对象在所述目标风险类别上的风险权重；

所述确定单元，还用于根据所述目标对象在所述目标风险类别上的风险权重确定所述目标对象的风险信息。

本申请实施例第三方面公开了一种服务器，包括处理器、存储器和网络接口，所述处理器、存储器和网络接口相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行上述第一方面的方法。

本申请实施例第四方面公开了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。

本申请实施例第五方面公开了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在计算机可读存储介质中。服务器的处理器从计算机可读存储介质读取所述计算机指令，处理器执行所述计算机指令，使得所述服务器执行上述第一方面的方法。

在本申请实施例中，服务器可以确定目标对象和样本对象集合，该样本对象集合包括一个或多个样本对象，样本对象集合中的所有样本对象对应M个风险类别，接着，从样本对象集合中确定风险类别为目标风险类别的N个样本对象，该目标风险类别为M个风险类别中的任一种，进一步的，可以获取N个样本对象中每一个样本对象在所述目标风险类别上的风险权重，以及确定目标对象与每一个样本对象之间的关联强度，并根据每一个样本对象在目标风险类别上的风险权重，以及目标对象与所述每一个样本对象之间的关联强度确定目标对象在目标风险类别上的风险权重，再根据目标对象在目标风险类别上的风险权重确定目标对象的风险信息。通过实施上述方法，可以准确的获得对象的风险信息，并利用风险信息确定对象的风险类别，从而可以有效的提高风险类别的识别精度。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种风险识别系统的架构示意图；

图2是本申请实施例提供的一种数据处理方法的流程示意图；

图3是本申请实施例提供的一种数据处理方法的流程示意图；

图4是本申请实施例提供的一种数据处理方法的流程示意图；

图5a是本申请实施例提供的一种风险类别推荐界面方法的界面示意图；

图5b是本申请实施例提供的一种风险类别推荐界面方法的界面示意图；

图6是本申请实施例提供的一种数据处理装置的结构示意图；

图7是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

云技术(Cloud Technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。

云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。

云计算(Cloud Computing)是一种计算模式，它将计算任务分布在大量计算机构成的资源池上，使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的，并且可以随时获取，按需使用，随时扩展，按使用付费。

本申请可以将数据处理所需的数据存储到“云”中，根据需求对云中的数据随时获取，随时扩展，例如，在确定目标对象的风险信息之后，可以将风险信息存储到“云”中，若某个对象需要确定风险类别时，可以从“云”中获取相关信息，以确定风险类别。

针对目前部分主体的风险特征很少甚至没有，而无法准确得到主体的风险信息，以进一步确定主体的风险类别，本申请实施例提供了一种如图1所示的风险识别系统的架构示意图。本申请涉及终端101和服务器102。

以终端101为例，终端101可以用户在风险类别推荐界面输入的待识别对象，并将该待识别对象发送至服务器102。而服务器102在确定待识别对象之后，可以根据针对该待识别对象的风险信息，确定针对该待识别对象确定的待推荐风险类别。当该待识别对象为非群体对象时，服务器102可以根据待识别对象的风险信息确定该待识别对象所对应的待推荐风险类别，当该待识别对象为特定群体中的群体对象时，服务器102可以根据特定群体中各个群体对象的风险信息确定特定群体的待推荐风险类别。

后续，服务器102将确定的待推荐风险类别发送给终端101，以使得在终端的风险类别推荐界面上显示该待推荐风险类别。

图1所示的服务器102可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。

终端101可以是手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(MID，Mobile Internet Device)等智能设备。终端101与服务器102可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

基于图1的风险识别系统，本申请实施例提出了一种数据处理方法，服务器可以确定目标对象和样本对象集合，该样本对象集合包括一个或多个样本对象，样本对象集合中的所有样本对象对应M个风险类别，接着，从样本对象集合中确定风险类别为目标风险类别的N个样本对象，该目标风险类别为M个风险类别中的任一种，进一步的，可以获取N个样本对象中每一个样本对象在所述目标风险类别上的风险权重，以及确定目标对象与每一个样本对象之间的关联强度，并根据每一个样本对象在目标风险类别上的风险权重，以及目标对象与所述每一个样本对象之间的关联强度确定目标对象在目标风险类别上的风险权重，再根据目标对象在目标风险类别上的风险权重确定目标对象的风险信息。通过实施上述方法，可以准确的获得对象的风险信息，并利用风险信息进一步的确定对象的风险类别，从而可以有效的提高风险类别的识别精度。

在一种实现方式中，本申请实施例提供的数据处理方法还基于区块链技术。例如，执行数据处理方法的相关处理端(如上述图1对应实施例中的服务器和终端)可以是区块链网络中的节点，本申请实施例所涉及的诸如风险信息等可以区块的形式存储在区块链网络中。

以下对本申请实施例的技术方案的实现细节进行详细阐述：

请参见图2，图2是本申请实施例提供的一种数据处理方法的流程示意图，数据处理方法包括以下步骤：

S201：确定目标对象和样本对象集合。

在一种实现方式中，目标对象是本申请实施例中需要确定的其风险信息的对象，该目标对象可以是某个账号体系内的账号，例如，目标对象可以是银行体系内的银行账号等等，下述的样本对象和待识别对象可以作同样理解。样本对象集合可以包括一个或多个样本对象，并且样本对象集合中的所有样本对象对应M个风险类别，其中，样本对象集合中的样本对象可以理解为黑样本，例如，为更好的理解本申请实施例所提供的数据处理方法，可以参考图3所示的流程进行进一步说明，在数据处理方法流程中，可以先采集黑样本数据，而黑样本即是历史记录中所上报过的风险对象，并且，每个黑样本可上报其对应的风险类别，其中，风险类别可以是赌博、传销、跨境汇兑、电信诈骗、套现等等。其中，黑样本数据即是上述的样本对象集合中的样本对象以及所有样本对象对应的M个风险类别。例如，表1所示为样本对象集合中的部分样本对象以及每个样本对象所上报过的风险类别。假设M为4，即在本申请实施中考虑有4个风险类别。针对任一样本对象而言，表1中的0表示在样本对象不存在该风险类别，对应的，1表示在样本对象存在该风险类别。那么，从表1中可以看出，样本对象A的风险类别为风险类别2，样本对象B的风险类别为风险类别1。在本申请中，将样本对象集合中的各个样本对象作为风险传播源，各个样本对象可以理解为已标记对象，那么，可以利用各个已标记对象的风险信息来确定未被标记对象的风险信息。其中，目标对象即可以理解为未被标记对象。

表1：

样本对象	风险类别1	风险类别2	风险类别3	风险类别4
					A	0	1	0	0
B	1	0	0	0
					C	0	0	0	1
D	0	0	1	0

S202：从样本对象集合中确定风险类别为目标风险类别的N个样本对象。

需要说明的是，在下述确定目标对象在各个风险类别上的风险信息时，考虑到目标对象在确定每一个风险类别上的风险信息的实施方式类似，本申请实施例主要以目标对象确定目标风险类别上的风险信息为例进行说明，其中目标风险类别为M个风险类别中的任一种。

在一种实现方式中，在确定N个样本对象时，可以考虑该N个样本对象是与目标对象具有关联关系的对象，也可以不考虑N个样本对象是否与目标对象具有关联关系。

可选的，在不考虑N个样本对象是否与目标对象具有关联关系的情况下，N个样本对象即是样本对象集合中风险类别均为目标风险类别的样本对象。具体地，样本对象集合中的各个样本对象可能对应不同的风险类别，例如，表1所示，样本对象A的风险类别为风险类别2，样本对象D的风险类别为风险类别3。假设目标风险类别为风险类别1，则可以从样本对象集合中确定出所有风险类别均为风险类别1的样本对象。

在一种实现方式中，在考虑该N个样本对象是与目标对象具有关联关系的对象的情况下，N个样本对象即是样本对象集合中风险类别均为目标风险类别，且与目标对象具有关联关系的N个样本对象。其中，关联关系可以是对象之间存在的资金关系、媒介关系、社交关系等等，其中，关联关系可以包括上述的一种或多种，在本申请不做限定。

举例来说，根据图3所示的数据处理流程中可以看出，针对某个体系内的各个对象，可以采集关系数据，即可以采集各个对象之间的关联关系，例如，以关联关系包括资金关系、媒介关系、社交关系为例进行说明，采集的关系数据即是针对各个对象之间具有资金关系、媒介关系、社交关系的数据。其中，资金关系可以是各个对象之间的资金交易等资金往来数据，例如，资金交易可以是对象之间的转账、发红包等等。如表2所示为各个对象之间的资金关系，其中，第一对象可以理解为资金的流出方，第二对象为资金的流入方，资金总数为资金交易的总数额，资金笔数为资金交易的次数，资金场景数为资金交易的不同场景数量，资金涉及场景可以是微信红包，微信转账，银行卡转账等等。例如，以第一对象为A，第二对象为B进行说明，A与B之间的资金交易的总数额为38747，其中，在微信红包，微信转账，银行卡转账3种场景中共交易了283次。

表2：

第一对象	第二对象	资金总量	资金笔数	资金场景数
					A	B	38747	283	3
A	C	4837	38	2
					A	D	29304	293	4
E	F	239	2	1

其中，如表3所示为各个对象之间的媒介关系，媒介关系可以是各个对象之间共同使用过的媒介介质的数据，例如，对象之间具有的终端设备使用同一个IP地址，连接同一个WIFI网络，利用同一个收货地址等等，例如，以第一对象为A，第二对象为B进行说明，A与B之间媒介介质数为3，媒介交互频次为283，可以理解为A与B之间使用的3个媒介介质数为同一个IP地址、同一个WIFI网络、同一个收货地址，且使用各个媒介介质数的次数为283。

表3：

第一对象	第二对象	媒介介质数	媒介交互频次
				A	B	3	283
A	C	2	38
				A	D	2	1234
E	F	4	421

其中，如表3所示为各个对象之间的社交关系，社交关系可以是各个对象之间在社交软件中所拥有的关系数据，例如，对象之间是微信好友，在同一个微信好友群，有各自的通讯方式等等。例如，以第一对象为A，第二对象为B进行说明，A与B之间好友场景数为2，社交交互频次为163，可以理解为A与B之间2个好友场景为微信好友、有各自的通讯方式，且在各个好友场景下的社交交互次数为163。

表4：

第一对象	第二对象	好友场景数	社交交互频次
				A	B	2	163
A	C	2	78
				A	D	5	534
E	F	3	230

S203：获取N个样本对象中每一个样本对象在目标风险类别上的风险权重，以及确定目标对象与每一个样本对象之间的关联强度。

在一种实现方式中，可以获取N个样本对象中每一个样本对象在目标风险类别上的风险权重，其中风险权重可以理解为存在风险类别的概率，即风险权重越大，存在风险类别的概率越大，对应的，风险权重越小，存在风险类别的概率越小。

在一种实现方式中，在确定目标对象与每一个样本对象之间的关联强度时，可以考虑在每一个样本对象与目标对象具有关联关系的情况下确定目标对象与每一个样本对象之间的关联强度。在这种情况下，即可以根据上述步骤S202中描述的关联关系来确定目标对象与每一个样本对象之间的关联强度。例如，以关联关系包括对象之间存在的资金关系、媒介关系、社交关系为例进行说明，如图3所示，可以利用采集到的各个关系中的关系数据来确定关联强度，其中，确定2个对象之间的关联强度的数学表示方式可以如公式1所示。那么，目标对象与每一个样本对象之间的关联强度可以利用公式1确定。

Q_ij＝F_ij(资金总量，资金笔数，资金场景数，媒介介质数，公式1媒介交互频次，好友场景数，好友交互频次)

其中，Q_ij的取值范围为[0,1)，且该Q_ij值越大，则代表对象i和对象j之间的关联关系越强，当Q_ij为0，则代表对象i和对象j之间不存在关联关系。F_ij(x)表示关系强度函数，i和j表示任意两个对象，该关系强度函数可以根据不同的业务情况确定，在本申请不做限定。例如，确定2个对象之间的关联强度具体可以如公式2所示。

Q_ij＝(sigmod(资金总量/10000)+sigmod(笔数/100)+sigmod(资公式2金场景/2)+sigmod(媒介介质数/2)+sigmod(媒介交互频次/100)+sigmod(好友场景数/2)+sigmod(好友交互频次/100)-3.5)/3.5

其中，sigmod(x)函数具体为1/1+e-^x。需要说明的是，公式1中的各个关系参数(资金总量，资金笔数，资金场景数，媒介介质数，媒介交互频次，好友场景数，好友交互频次)可以考虑使用部分，也可以使用全部，例如，当关联关系包括资金关系时，则确定2个对象之间的关联强度的数学表示方式可以如公式3所示。

Q_ij＝F_ij(资金总量，资金笔数，资金场景数) 公式3

在一种实现方式中，在确定目标对象与每一个样本对象之间的关联强度时，除了可以利用公式1中的各个关系参数(资金总量，资金笔数，资金场景数，媒介介质数，媒介交互频次，好友场景数，好友交互频次)来确定目标对象与每一个样本对象之间的关联强度，还可以考虑利用其他与关系参数来确定，例如，与对象相关的出入资金量、风险程度等关系参数。

在一种实现方式中，也可以在不考虑N个样本对象是否与目标对象具有关联关系的情况下确定目标对象与每一个样本对象之间的关联强度，在这种情况下，在体系内任意两个对象之间的关系强度对应的参数可以均定义为1。那么，目标对象与每一个样本对象之间的关联强度对应的参数均为1。

S204：根据每一个样本对象在目标风险类别上的风险权重，以及目标对象与每一个样本对象之间的关联强度确定目标对象在目标风险类别上的风险权重。

在一种实现方式中，在确定每一个样本对象在目标风险类别上的风险权重，以及目标对象与每一个样本对象之间的关联强度之后，即可根据每一个样本对象在目标风险类别上的风险权重，以及目标对象与每一个样本对象之间的关联强度确定目标对象在目标风险类别上的风险权重。具体地，可以针对N个样本对象中的任一样本对象为例进行说明，可以先将目标对象与该样本对象之间的关联强度，与样本对象在目标风险类别上的风险权重进行相乘，以得到衰减参数，在确定衰减参数之后，可以计算设定数值与该衰减参数之间的差值，以得到目标对象与该样本对象之间的衰减差值，其中，设定数值可以是1，也可以是其他数值，在本申请不做限定。根据上述计算目标对象与一个样本对象之间的衰减差值的方法，计算目标对象与N个样本对象中各个样本对象之间的衰减差值。接着，将目标对象与N个样本对象中各个样本对象之间的衰减差值进行连乘处理，并根据连乘处理结果确定目标对象在目标风险类别上的风险权重。可选的，在根据连乘处理结果确定目标对象在目标风险类别上的风险权重时，具体可以是将某一数值与该连乘处理结果之间的差值确定为目标对象在目标风险类别上的风险权重。其中，该某一数值可以是1，也可以是其他数值。将上述确定目标对象在目标风险类别上的风险权重利用数学表示可以如公式4所示。

其中，R表示目标对象在目标风险类别上的风险权重，W_k表示第k个样本对象在目标风险类别上的风险权重，P_k目标对象与第k个样本对象之间的关联强度。

在一种实现方式中，考虑到目标对象与各个样本对象之间的关联强度的确定方法不同，上述公式4也会存在不同。例如，假设目标对象与各个样本对象之间的关联强度是利用关联关系中的关系参数来确定的，则P_k值可以根据公式1来确定。又如，假设目标对象与各个样本对象之间的关联强度是根据其他关系参数来确定的，则确定目标对象在目标风险类别上的风险权重利用数学表示可以如公式5所示。其中，公式5中的t表示与其他关系参数相关的一个调节参数。又如，假设目标对象与各个样本对象之间的关联强度是在不考虑关联关系的情况下确定的，则确定目标对象在目标风险类别上的风险权重利用数学表示可以如公式6所示，即P_k＝1。

需要说明的是，在通过公式4或公式5或公式6确定目标对象在目标风险类别上的风险权重时，即可以理解为，目标风险类别向外传播了一层，而目标对象被传染为因目标风险类别会因传染源(即样本对象)的数量、以及与各个传染源之间的关联关系强弱的不同而不同。而且本申请可以通过各个对象之间的关联关系，将已经标记的风险对象及其风险类别，通过风险传播的方法，将风险类别逐步传递给其他对象，以确定其他对象被传染上不同风险类别的风险权重。

S205：根据目标对象在目标风险类别上的风险权重确定目标对象的风险信息。

在一种实现方式中，可以利用步骤S205确定目标对象在目标风险类别上的风险权重的方法，确定目标对象在M个风险类别中其他风险类别上的风险权重，以得到目标对象在M个风险类别中各个风险类别上的风险权重。其中，目标对象在M个风险类别中各个风险类别上的风险权重即是目标对象的风险信息。例如，假设M＝4，即风险类别包括风险类别1、风险类别2、风险类别3、风险类别4，且目标风险类别为风险类别1，那么，在根据步骤S205确定目标对象在风险类别1上的风险权重之后，还可以根据步骤S205中确定目标对象在风险类别1上的风险权重的方法分别确定目标对象在风险类别2、风险类别3、风险类别4上的风险权重。

在一种实现方式中，为了得到体系内各个对象的风险信息，可以参考上述确定目标对象的风险信息的方法继续计算体系内其他对象在各个风险类别上的风险权重的，以得到体系内每一个对象的风险信息，如图3所示的数据处理流程，可以各个对象之间的关联强度以及所采集的黑样本数据(黑样本数据可以包括根据每一个样本对象在各个风险类别上的风险权重)，计算各个对象的风险信息。例如，表5所示为体系内部分对象的风险信息，即部分对象在各个风险类别上的风险权重。

表5：

对象	风险类别1	风险类别2	风险类别3	风险类别4
					对象1	0.11	0.00	0.00	0.32
对象2	0.56	0.00	0.11	0.00
					对象3	0.00	0.98	0.03	0.00
对象3	0.00	0.00	0.78	0.00

在一种实现方式中，上述目标对象可以是未被传染标记的对象，即目标对象可以是样本对象集合之外的对象，也可以是已经被传染标记的对象，即目标对象可以是样本对象集合内的样本对象。也就是说，在利用风险传播的方法确定目标对象的风险信息时，针对已经被传染标记的对象(样本对象集合内的样本对象)，可以只作为传染源不再根据周围对象情况重复计算更新风险权重，也可以每次都重复计算更新风险权重，那么样本对象的风险信息以及风险类别也会略有不同。那么在实际业务场景中，是否需要更新样本对象的风险信息可以根据业务需求调整，在本申请不做限定。

在本请申请实施例中，服务器可以确定目标对象和样本对象集合，该样本对象集合包括一个或多个样本对象，样本对象集合中的所有样本对象对应M个风险类别，接着，从样本对象集合中确定风险类别为目标风险类别的N个样本对象，该目标风险类别为M个风险类别中的任一种，进一步的，可以获取N个样本对象中每一个样本对象在所述目标风险类别上的风险权重，以及确定目标对象与每一个样本对象之间的关联强度，并根据每一个样本对象在目标风险类别上的风险权重，以及目标对象与所述每一个样本对象之间的关联强度确定目标对象在目标风险类别上的风险权重，再根据目标对象在目标风险类别上的风险权重确定目标对象的风险信息。通过实施上述方法，可以通过各个对象之间关联关系的角度，利用标签传播的方法，将已经标记的风险对象的风险类别逐步传播给关联对象，当被关联对象的风险特征信息较少时，也可以通过其它对象传播过来的风险信息准确的得到自身的风险信息，从而可以有效的提高风险类别的识别精度。

请参见图4，图4是本申请实施例提供的一种数据处理方法的流程示意图，数据处理方法包括以下步骤：

S401：确定目标对象和样本对象集合，从样本对象集合中确定风险类别为目标风险类别的N个样本对象。

S402：获取N个样本对象中每一个样本对象在目标风险类别上的风险权重，以及确定目标对象与每一个样本对象之间的关联强度。

S403：根据每一个样本对象在目标风险类别上的风险权重，以及目标对象与每一个样本对象之间的关联强度确定目标对象在目标风险类别上的风险权重。

S404：根据目标对象在目标风险类别上的风险权重确定目标对象的风险信息。

S405：确定待识别对象。

在一种实现方式中，该待识别对象可以包含在参考对象集合中，而上述的目标对象和样本对象集合中的样本对象可以包含在参考对象集合中。

在一种实现方式中，服务器可以输出风险类别推荐界面，并显示在用户终端界面上，当用户需要了解某个账户的风险类别时，用户可以根据风险类别推荐界面获取用户所需要的信息，具体地，用户可以在该风险类别推荐界面上输入待识别对象，并在该风险类别推荐界面上获取服务器针对该待识别对象确定的待推荐风险类别。其中，该风险类别推荐界面可以包括操作区域和结果显示区域，操作区域用于供用户输入某一对象，该操作区域可以包括对象设置项以及确认控件，结果显示区域用于显示针对该待识别对象确定的待推荐风险类别。而当确认控件被选中时，将针对对象设置项输入的对象确定待识别对象。例如，风险类别推荐界面可以如图5a所示，操作区域可以如图5a中由501标记的区域所示，对象设置项可以如图5a中由502标记的区域所示，确认控件可以如图5a中由503标记的控件所示。用户可以在如图5a中由502标记的区域输入某一对象，并点击如图5a中由503标记的控件，那么，用户输入的对象即为待识别对象。

S406：当待识别对象为非群体对象时，根据待识别对象的风险信息确定待识别对象所对应的待推荐风险类别。

在一种实现方式中，在确定待识别对象之后，如图3所示，就可以根据待识别对象的风险信息确定待识别对象所对应的待推荐风险类别。而当待识别对象为非群体对象和群体对象时，可以根据不同的方法确定该待识别对象所对应的待推荐风险类别。

在一种实现方式中，当待识别对象为非群体对象时，即待识别对象为单个主体时，可以根据待识别对象的风险信息，对待识别对象在各个风险类别上的风险权重进行降序排序，以得到风险权重排序结果。而在得到风险权重排序结果之后，可以将风险权重排序结果中排在前L位的风险权重所对应的风险类别作为待识别对象的待推荐风险类别。其中，L可以为正整数，例如，L可以是1，也可以是大于1的数值，在本申请不做限定。例如，当L可以是1时，则是将风险权重排序结果中排在第1位的风险权重所对应的风险类别作为待识别对象的待推荐风险类别。又如，当L可以是3时，则是将风险权重排序结果中排在前3位的风险权重所对应的风险类别作为待识别对象的待推荐风险类别。

在一种实现方式中，在服务器确定待识别对象的待推荐风险类别之后，可以将该待推荐风险类别发送至终端，以使得待推荐风险类别显示在风险类别推荐界面上的结果显示区域中。例如，结果显示区域可以是如图5a中由504标记的区域所示。其中，当L可以是1，即针对待识别对象的待推荐风险类别的数量为1时，可以直接将该待推荐风险类别显示在风险类别推荐界面上的结果显示区域中。当L为大于1的数值，即针对待识别对象的待推荐风险类别的数量为多个时，可以按照每个待推荐风险类别对应的风险权重从大到小的顺序，在风险类别推荐界面上的结果显示区域中显示多个待推荐风险类别，以便于用户根据结果显示区域中的显示结果自行选择待识别对象的风险类别。

举例来说，当L为3时，即待识别对象的待推荐风险类别包括待推荐风险类别1、待推荐风险类别2、待推荐风险类别3，该3个待推荐风险类别分别对应的风险权重为0.89、0.23、0.52，那么，在结果显示区域中待推荐风险类别的显示顺序为待推荐风险类别1、待推荐风险类别3、待推荐风险类别2。

在一种实现方式中，考虑到待识别对象在风险传播过程中确定为某一风险类别的风险权重很小时，那么待识别对象本身在真实场景中为该风险类别的概率可能比较低，因此，为了减少对用户的误导，可以在风险类别的风险权重小于某个比较小的数值时，在风险类别推荐界面上的结果显示区域中不显示针对待识别对象的待推荐风险类别，而由用户自行判定针对待识别对象的待推荐风险类别。具体实现中，当待识别对象为非群体对象时，可以根据待识别对象的风险信息，将待识别对象在各个风险类别上的风险权重分别与设定阈值进行比较，如果待识别对象在各个风险类别上的风险权重均小于设定阈值，则可以确定该待识别对象的待推荐风险类别为空。其中，设定阈值可以预先设置，该设定阈值可以是一个比较小的数值，而待推荐风险类别为空可以理解为在结果显示区域中不显示针对待识别对象的待推荐风险类别。

S407：当待识别对象为特定群体中的群体对象时，根据特定群体中各个群体对象的风险信息确定特定群体的待推荐风险类别。

在一种实现方式中，当待识别对象为特定群体中的群体对象时，以针对M个风险类别中的任一风险类别为例进行说明，可以根据特定群体中的各个群体对象的风险信息，计算特定群体中的各个群体对象在该任一风险类别上的风险权重和值。而在特定群体在各个风险类别上的风险权重和值之后，可以从特定群体在各个风险类别上的风险权重和值中确定最大风险权重和值，并将该最大风险权重和值所对应的风险类别作为特定群体的待推荐风险类别。

举例来说，假设待识别对象所在特定群体中的群体对象有3个，即特定群体包括群体对象1、群体对象2、群体对象3，其中，待识别对象为群体对象1；风险类别的数量为4，即风险类别包括风险类别1、风险类别2、风险类别3、风险类别4。那么，可以计算特定群体在风险类别1上的风险权重和值，即计算群体对象1在风险类别1上的风险权重、群体对象2在风险类别1上的风险权重，以及群体对象3在风险类别1上的风险权重的和值。同理，可以计算特定群体在风险类别2上的风险权重和值，计算特定群体在风险类别3上的风险权重和值，计算特定群体在风险类别4上的风险权重和值。例如，表6表示的是特定群体在各个风险类别上的风险权重，根据表6中的数据可以确定特定群体在风险类别1上的风险权重和值为0.11、在风险类别2上的风险权重和值为0.98、在风险类别3上的风险权重和值为0.14、在风险类别4上的风险权重和值为0.32。可知，上述4个风险权重和值中的最大风险权重和值0.98，而最大风险权重和值0.98对应的风险类别为风险类别2，那么，风险类别2为特定群体的待推荐风险类别。

表6：

群体对象	风险类别1	风险类别2	风险类别3	风险类别4
					群体对象1	0.11	0.00	0.00	0.32
群体对象2	0.00	0.00	0.11	0.00
					群体对象3	0.00	0.98	0.03	0.00

在一种实现方式中，当待识别对象为特定群体中的群体对象时，可以根据特定群体中各个群体对象的风险信息，先确定特定群体中各个群体对象所对应的候选风险类别。其中，确定特定群体中各个群体对象所对应的候选风险类别的具体实施方式可以是：针对特定群体中的任一群体对象，可以先根据群体对象的风险信息从群体对象在各个风险类别上的风险权重中确定最大风险权重，再将最大风险权重所对应的风险类别作为群体对象对应的候选风险类别。而在各个群体对象所对应的候选风险类别之后，可以确定各个候选风险类别所对应的群体对象数量，再将所对应群体对象数量最多的候选风险类别作为特定群体的待推荐风险类别。

举例来说，假设待识别对象所在特定群体中的群体对象有10个，待识别对象为特定群体中的某一群体对象。其中，在特定群体中，风险类别1所对应的群体对象数量为2，风险类别2所对应的群体对象数量为7，风险类别3所对应的群体对象数量为1。那么，所对应群体对象数量最多的候选风险类别为风险类别2，即可以确定风险类别2为特定群体的待推荐风险类别。

在一种实现方式中，同待识别对象为非群体对象作同样理解，当待识别对象为特定群体中的群体对象时，针对所述待识别对象确定的特定群体的待推荐风险类别也可以显示在风险类别推荐界面上的结果显示区域中。其中，结果显示区域中显示的待推荐风险类别为针对待识别对象所在特定群体的风险类别。而结果显示区域中除了可以显示待推荐风险类别，还可以显示待识别对象所在特定群体中的各个群体对象，以使得用户根据风险类别推荐界面上的显示结果还可以了解特定群体中其他群体的风险类别。例如，风险类别推荐界面上的结果显示区域可以如图5b中由505标记的区域所示，假设待识别对象为特定群体中的群体对象A，从图5b中可以看出，在结果显示区域，可以显示特定群体的风险类别，还可以显示特定群体中的各个群体对象，该特定群体中的群体对象包括A、B、C以及D。

在本申请实施例中，服务器可以确定目标对象和样本对象集合，接着，从样本对象集合中确定风险类别为目标风险类别的N个样本对象，进一步的，可以获取N个样本对象中每一个样本对象在所述目标风险类别上的风险权重，以及确定目标对象与每一个样本对象之间的关联强度，并根据每一个样本对象在目标风险类别上的风险权重，以及目标对象与所述每一个样本对象之间的关联强度确定目标对象在目标风险类别上的风险权重，再根据目标对象在目标风险类别上的风险权重确定目标对象的风险信息。而当服务器获取到终端发送的待识别对象之后，可以根据该待识别对象的风险信息确定待识别对象所对应的待推荐风险类别。且当待识别对象为非群体对象时，根据待识别对象的风险信息确定待识别对象所对应的待推荐风险类别。当待识别对象为特定群体中的群体对象时，根据特定群体中各个群体对象的风险信息确定特定群体的待推荐风险类别。通过实施上述方法，可以将已经标记的风险对象及其风险类别，通过风险传播的方法，将风险类别逐步传递给其他对象，以确定其他对象被传染上不同风险类别的风险权重，从而使得根据不同风险类别的风险权重确定对象的风险类别，进而可以提高风险类别的识别精度。同时，也可以提高打标对象的广度，经过验证，利用本申请的方法，可以提高打标人数约130％左右。若将本申请所确定风险类别的方法应用到风险控制等场景中，也可以很好的识别出不同对象的风险类别，从而加强信息安全。

请参阅图6，是本申请实施例提供的一种数据处理装置的结构示意图。本实施例中所描述的数据处理装置，包括：

确定单元601，用于确定目标对象和样本对象集合，所述样本对象集合包括一个或多个样本对象，所述样本对象集合中的所有样本对象对应M个风险类别；

所述确定单元601，还用于从所述样本对象集合中确定风险类别为目标风险类别的N个样本对象，所述目标风险类别为所述M个风险类别中的任一种；

获取单元602，用于获取所述N个样本对象中每一个样本对象在所述目标风险类别上的风险权重，以及确定所述目标对象与所述每一个样本对象之间的关联强度；

所述确定单元601，还用于根据所述每一个样本对象在所述目标风险类别上的风险权重，以及所述目标对象与所述每一个样本对象之间的关联强度确定所述目标对象在所述目标风险类别上的风险权重；

所述确定单元601，还用于根据所述目标对象在所述目标风险类别上的风险权重确定所述目标对象的风险信息。

在一种实现方式中，所述确定单元601，具体用于：

针对所述N个样本对象中的任一样本对象，将所述目标对象与所述样本对象之间的关联强度，与所述样本对象在所述目标风险类别上的风险权重进行相乘，得到衰减参数；

计算设定数值与所述衰减参数之间的差值，得到所述目标对象与所述样本对象之间的衰减差值；

将所述目标对象与所述N个样本对象中各个样本对象之间的衰减差值进行连乘处理，并根据连乘处理结果确定所述目标对象在所述目标风险类别上的风险权重。

在一种实现方式中，所述目标对象和所述样本对象集合中的样本对象包含在参考对象集合中，所述目标对象的风险信息包括所述目标对象在所述M个风险类别中的各个风险类别上的风险权重；所述确定单元601，还用于：

确定待识别对象，所述待识别对象包含在所述参考对象集合中；

当所述待识别对象为非群体对象时，根据所述待识别对象的风险信息确定所述待识别对象所对应的待推荐风险类别；

当所述待识别对象为特定群体中的群体对象时，根据所述特定群体中各个群体对象的风险信息确定所述特定群体的待推荐风险类别。

在一种实现方式中，所述确定单元601，具体用于：

当所述待识别对象为非群体对象时，根据所述待识别对象的风险信息，对所述待识别对象在所述各个风险类别上的风险权重进行降序排序，得到风险权重排序结果；

将所述风险权重排序结果中排在前L位的风险权重所对应的风险类别作为所述待识别对象的待推荐风险类别。

在一种实现方式中，所述确定单元601，具体用于：

当所述待识别对象为非群体对象时，根据所述待识别对象的风险信息，将所述待识别对象在所述各个风险类别上的风险权重分别与设定阈值进行比较；

若所述待识别对象在所述各个风险类别上的风险权重均小于所述设定阈值，则确定所述待识别对象的待推荐风险类别为空。

在一种实现方式中，所述确定单元601，具体用于：

当所述待识别对象为特定群体中的群体对象时，针对所述M个风险类别中的任一风险类别，根据所述特定群体中的各个群体对象的风险信息，计算所述特定群体中的各个群体对象在所述风险类别上的风险权重和值；

从所述特定群体在各个风险类别上的风险权重和值中确定最大风险权重和值，并将所述最大风险权重和值所对应的风险类别作为所述特定群体的待推荐风险类别。

在一种实现方式中，所述确定单元601，具体用于：

当所述待识别对象为特定群体中的群体对象时，根据所述特定群体中各个群体对象的风险信息，确定所述特定群体中各个群体对象所对应的候选风险类别；

确定各个候选风险类别所对应的群体对象数量；

将所对应群体对象数量最多的候选风险类别作为所述特定群体的待推荐风险类别。

在一种实现方式中，所述确定单元601，具体用于：

针对所述特定群体中的任一群体对象，根据所述群体对象的风险信息从所述群体对象在所述各个风险类别上的风险权重中确定最大风险权重；

将所述最大风险权重所对应的风险类别作为所述群体对象对应的候选风险类别。

在一种实现方式中，所述确定单元601，具体用于：

从所述样本对象集合中确定风险类别为目标风险类别，且与所述目标对象具有关联关系的N个样本对象。

在一种实现方式中，所述确定单元601，具体用于：

输出风险类别推荐界面，所述风险类别推荐界面包括操作区域和结果显示区域，所述操作区域包括对象设置项以及确认控件；

当所述确认控件被选中时，将针对所述对象设置项输入的对象确定待识别对象；

所述装置还包括显示单元603，所述显示单元603，具体用于：

在所述结果显示区域中显示针对所述待识别对象确定的待推荐风险类别。

可以理解，本申请实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。本申请实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

请参阅图7，是本申请实施例提供的一种服务器的结构示意图。本实施例中所描述的服务器，包括：处理器701、存储器702以及网络接口703。上述处理器701、存储器702以及网络接口703之间可以交互数据。

上述处理器701可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

上述存储器702可以包括只读存储器和随机存取存储器，并向处理器701提供程序指令和数据。存储器702的一部分还可以包括非易失性随机存取存储器。其中，所述处理器701调用所述程序指令时用于执行：

在一种实现方式中，所述处理器701，具体用于：

在一种实现方式中，所述目标对象和所述样本对象集合中的样本对象包含在参考对象集合中，所述目标对象的风险信息包括所述目标对象在所述M个风险类别中的各个风险类别上的风险权重；所述处理器701，还用于：

在一种实现方式中，所述处理器701，具体用于：

确定各个候选风险类别所对应的群体对象数量；

在一种实现方式中，所述处理器701，具体用于：

本申请实施例还提供了一种计算机存储介质，该计算机存储介质中存储有程序指令，所述程序执行时可包括如图2或者图4对应实施例中的数据处理方法的部分或全部步骤。

需要说明的是，对于前述的各个方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某一些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random AccessMemory，RAM)、磁盘或光盘等。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。服务器的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该服务器执行上述各方法的实施例中所执行的步骤。

以上对本申请实施例所提供的一种数据处理方法、装置、服务器以及存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种数据处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述每一个样本对象在所述目标风险类别上的风险权重，以及所述目标对象与所述每一个样本对象之间的关联强度确定所述目标对象在所述目标风险类别上的风险权重，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述目标对象和所述样本对象集合中的样本对象包含在参考对象集合中，所述目标对象的风险信息包括所述目标对象在所述M个风险类别中的各个风险类别上的风险权重；所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述当所述待识别对象为非群体对象时，根据所述待识别对象的风险信息确定所述待识别对象所对应的待推荐风险类别，包括：

5.根据权利要求3所述的方法，其特征在于，所述当所述待识别对象为非群体对象时，根据所述待识别对象的风险信息确定所述待识别对象所对应的待推荐风险类别，包括：

6.根据权利要求3所述的方法，其特征在于，所述当所述待识别对象为特定群体中的群体对象时，根据所述特定群体中的各个群体对象的风险信息确定所述特定群体的待推荐风险类别，包括：

7.根据权利要求3所述的方法，其特征在于，所述当所述待识别对象为特定群体中的群体对象时，根据所述特定群体中的各个群体对象的风险信息确定所述特定群体的待推荐风险类别，包括：

确定各个候选风险类别所对应的群体对象数量；

8.根据权利要求7所述的方法，其特征在于，所述根据所述特定群体中各个群体对象的风险信息，确定所述特定群体中各个群体对象所对应的候选风险类别，包括：

9.根据权利要求1或2所述的方法，其特征在于，所述从所述样本对象集合中确定风险类别为目标风险类别的N个样本对象，包括：

10.根据权利要求3所述的方法，其特征在于，所述确定待识别对象包括：

其中，所述方法还包括：

11.一种数据处理装置，其特征在于，包括：

12.一种服务器，其特征在于，包括处理器、存储器和网络接口，所述处理器、存储器和网络接口相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1-10任一项所述的方法。

13.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令被处理器执行时，使得具有所述处理器的计算机设备执行权利要求1-10任一项所述的方法。