WO2020168851A1

WO2020168851A1 - 行为识别

Info

Publication number: WO2020168851A1
Application number: PCT/CN2020/071002
Authority: WO
Inventors: 张振华
Original assignee: 北京三快在线科技有限公司
Priority date: 2019-02-18
Filing date: 2020-01-08
Publication date: 2020-08-27
Also published as: CN109886699A

Abstract

一种行为识别方法及装置、电子设备，该方法包括：基于用户的历史行为对应的订单数据构建图模型，并确定所述图模型中包含的每个节点的初始置信度（S110）；通过所述订单数据得到针对所述用户的社区特征以及综合特征（S120）；通过所述社区特征、所述综合特征、所述初始置信度以及消息更新规则确定所述图模型的消息值，根据所述消息值确定所述图模型，并通过所述图模型计算当前行为对应的订单数据的置信度，以根据所述置信度确定所述当前行为的识别结果（S130）。

Description

行为识别

本申请要求于2019年02月18日提交、申请号为201910120241.2、发明名称为“行为识别方法及装置、电子设备、存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开涉及互联网技术领域，具体而言，涉及一种行为识别方法、行为识别装置、电子设备以及计算机可读存储介质。

背景技术

由于互联网金融具有成交量大、监控手段不完善等特点，使其很容易成为欺诈分子刷单、套现的首选。而手机充值支付的单笔金额小、日交易量大，其中发生的欺诈行为更容易被监控系统漏报。

常见的手机充值反欺诈方案中，一般根据用户的账户信息、行为特点等实时信息，判断用户当前的充值请求是否是欺诈行为。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种行为识别方法及装置、电子设备、存储介质，进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的不能准确识别欺诈行为的问题。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开的一个方面，提供一种行为识别方法，包括：基于用户的历史行为对应的订单数据构建图模型，并确定所述图模型中包含的每个节点的初始置信度；通过所述订单数据得到针对所述用户的社区特征以及综合特征；通过所述社区特征、所述综合特征、所述初始置信度以及消息更新规则确定所述图模型的消息值，根据所述消息值确定所述图模型，并通过所述图模型计算当前行为对应的订单数据的置信度，以根据所述置信度确定所述当前行为的识别结果。

在本公开的一种示例性实施例中，基于用户的历史行为对应的订单数据构建图模型包括：获取所述历史行为对应的订单数据，所述订单数据中包括与所述用户关联的用户号码以及充值号码；基于所述用户号码与所述充值号码之间的关联关系，构建所述图模型。

在本公开的一种示例性实施例中，基于所述用户号码与所述充值号码之间的关联关系，构建所述图模型包括：按照所述用户号码进行分组，构建所述用户号码与所述充值号码的共现矩阵，并根据所述共现矩阵构建所述图模型；或将所述用户号码以及所述充值号码联合作为索引构建共现数组，并根据所述共现数组构建所述图模型。

在本公开的一种示例性实施例中，确定所述图模型中包含的每个节点的初始置信度包括：根据多个用户的置信分数据以及历史参考号码，构建所述多个用户的置信数据集；基于所述置信数据集对一置信度预测函数进行训练，得到训练好的置信度预测函数；根据训练好的置信度预测函数对每个用户进行预测，确定每个用户对应的每个节点的所述初始置信度。

在本公开的一种示例性实施例中，通过所述订单数据得到针对所述用户的社区特征以及综合特征包括：基于所述订单数据构建所述图模型；利用渗透算法对所述图模型进行处理，得到团集合；根据所述团集合与历史参考号码对用户的置信数据集进行标注，以得到所述社区特征。

在本公开的一种示例性实施例中，通过所述订单数据得到针对所述用户的社区特征以及综合特征包括：获取针对所述用户的至少一个维度特征的数据，并对所述至少一个维度维度特征的数据进行聚类，得到所述综合特征。

在本公开的一种示例性实施例中，所述至少一个维度特征包括年龄习惯特征、实时消费特征、地理特征以及消费业务特征中的一种或多种，所述综合特征包括风险等级特征。

在本公开的一种示例性实施例中，通过所述社区特征、所述综合特征、所述初始置信度以及消息更新规则确定所述图模型的消息值包括：根据所述社区特征和所述综合特征生成权重训练数据；分别对所述权重训练数据以及所述置信数据集进行训练，得到多个权重系数；将所述多个权重系数以及所述综合特征输入所述消息更新规则，得到所述图模型的初始消息值。

在本公开的一种示例性实施例中，所述方法还包括：更新所述共现矩阵，并根据所述共现矩阵中各节点的共现频次对所述初始消息值进行更新，得到所述图模型的目标消息值。

在本公开的一种示例性实施例中，根据所述共现矩阵中各节点的共现频次对所述初始消息值进行更新，得到所述图模型的目标消息值包括：通过所述初始消息值计算所述充值号码满足预设条件的置信度；计算所有满足预设条件的充值号码的置信度损失；通过将所述置信度损失最小化对所述初始消息值进行优化，得到所述目标消息值。

在本公开的一种示例性实施例中，根据所述消息值确定所述图模型包括：针对所述共现矩阵以及所述目标消息值，生成所述图模型。

在本公开的一种示例性实施例中，所述方法还包括：对所述置信度大于预设值的订单数据进行预警。

根据本公开的一个方面，提供一种行为识别装置，包括：置信度计算模块，用于基于用户的历史行为对应的订单数据构建图模型，并确定所述图模型中包含的每个节点的初始置信度；特征提取模块，用于通过所述订单数据得到针对所述用户的社区特征以及综合特征；识别控制模块，用于通过所述社区特征、所述综合特征、所述初始置信度以及消息更新规则确定所述图模型的消息值，根据所述消息值确定所述图模型，并通过所述图模型计算当前行为对应的订单数据的置信度，以根据所述置信度确定所述当前行为的识别结果。

根据本公开的一个方面，提供一种电子设备，包括：处理器；以及

存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的行为识别方法。

根据本公开的一个方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任意一项所述的行为识别方法。

本公开示例性实施例中提供的一种行为识别方法、行为识别装置、电子设备以及计算机可读存储介质中，一方面，通过历史行为对应的订单数据得到针对用户的社区特征以及综合特征，增加了特征描述维度，避免了单一特征造成的误差，提高了准确率；一方面，通过社区特征、综合特征、初始置信度以及消息更新规则确定图模型的消息值进而根据消息值构建图模型，能够得到准确的消息值并且能够构建准确的图模型；另一方面，通过得到的图模型计算当前行为对应的订单数据的置信度，从而可以根据置信度快速准确地进行用户行为识别，及时避免欺诈风险。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示意性示出本公开示例性实施例中一种行为识别方法示意图；

图2示意性示出本公开示例性实施例中构建图模型的示意图；

图3示意性示出本公开示例性实施例中确定节点初始置信度的示意图；

图4示意性示出本公开示例性实施例中计算初始消息值的示意图；

图5示意性示出本公开示例性实施例中对初始消息值进行优化的示意图；

图6示意性示出本公开示例性实施例中一种行为识别装置的框图；

图7示意性示出本公开示例性实施例中一种电子设备的框图；

图8示意性示出本公开示例性实施例中一种程序产品。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

本公开提供的行为识别方法可以应用于电子设备中，该电子设备可以是手机、平板电脑、台式电脑等终端，也可以为服务器，如一台服务器或者一个服务器集群。

本示例实施方式中首先提供了一种行为识别方法，可以应用于各种反欺诈场景中，例如充值反欺诈、套现欺诈或者是电信欺诈等等。下面将参考图1所示对该行为识别方法进行详细描述。

在步骤S110中，基于用户的历史行为对应的订单数据构建图模型，并确定所述图模型中包含的每个节点的初始置信度。

本示例性实施例中，用户可以为注册至少一个平台的用户。历史行为可以为该用户在所有平台上的历史充值行为。订单数据指的是与用户对应的所有历史订单数据，例如可以为充值请求对应的充值订单数据，该订单数据中可以包括与用户对应的用户号码，用户号码可以是与用户账号即用户ID(Identity，身份标识)绑定的手机号，订单数据中还可以包括订单请求中包含的充值号码，该充值号码可以是用户账号进行充值的手机号。用户号码与充值号码可以相同，也可以不同，此处不作特殊限定。

其中，用户账号还可以是用户登录目标应用的账号，还可以是其他能唯一确定用户的标识，本公开实施例对用户账号不做限定，目标应用可以是为用户提供充值服务的应用。而订单数据中包括订单请求中包含的充值号码，可以是用户账号进行充值的手机号，也可以是用户账号进行充值的其他账号，例如，游戏账号等，本公开实施例对充值号码不做限定。

基于用户的历史行为对应的订单数据构建图模型的过程如图2所示，可以包括步骤S210和步骤S220：

在步骤S210中，获取所述历史行为对应的订单数据，所述订单数据中包括与所述用户关联的用户号码以及充值号码。

在本步骤中，每一个订单数据均可对应用户的一次充值行为。获取的订单数据可以包括用户ID、用户绑定号码、用户充值号码以及为充值号码的充值金额等等。除此之外，还可包括订单号码以及订单生成时间等等。

在步骤S220中，基于所述用户号码与所述充值号码之间的关联关系，构建所述图模型。

在本步骤中，用户号码以及充值号码之间的关联关系可以用一个用户号码为某一个充值号码的充值次数来描述。图模型例如可以为MRF(MRF-Markov Random Field，马尔科夫随机场)模型，也可以为条件随机场模型等等。MRF模型即为MRF图，例如可以为有向图。为了便于分析因果关系，MRF模型将图像模拟成一个随机变量组成的网格，其中的每一个变量具有明确的对由其自身之外的随机变量组成的近邻的依赖性即(马尔科夫性)。在一种可能实现方式中，步骤S220中的过程包括步骤S221和步骤S222两种方式：

	充值号码1	充值号码2	充值号码3	……
用户号码1	2	1	0	……
用户号码2	0	0	3	……
用户号码3	0	0	2	……
……	……	……	……	……

表1

在步骤S221中，按照所述用户号码进行分组，构建所述用户号码与所述充值号码的共现矩阵，并根据所述共现矩阵构建所述图模型。按照用户号码分组指的是按照用户绑定的用户号码将所有历史订单数据分组，由于用户可以绑定至少一个用户号码，则一个用户号码可分为一个组。共现矩阵指的是多个用户号码与多个充值号码共同出现的次数构成的矩阵。用户号码与充值号码的共现矩阵例如表1所示。

其中，共现矩阵E中的元素Eij表示的是用户号码i与充值号码j之间发生的订单数目。Eij＝0代表在号码i和j之间，不存在历史充值订单。

在得到共现矩阵之后，可以利用networkx构建一个空的图模型。例如可通过以下代码构建图模型：

import networkx as nx

def createGraph(A,V):

G＝nx.Graph()#建立一个空的图

G.add_nodes_from(V)#从v中添加节点

for edge in zip(A.index,A['cnt']):

nodes＝edge[0][:].split('_')

node1＝nodes[0]

node2＝nodes[1]

G.add_edges_from(node1,node2,weight＝edge[1])

return G

当用户号码和充值号码数目很多时，由于共现矩阵的存储需求过大，可能将导致内存溢出，可采用共现数组构建图模型。在步骤S222中，将所述用户号码以及所述充值号码联合作为索引构建共现数组，并根据所述共现数组构建所述图模型。在本步骤中，与步骤S221类似地，可先获取历史行为对应的订单数据，所述订单数据中包括与所述用户关联的用户号码以及充值号码。接下来建立用于描述多个用户号码与多个充值号码共同出现的次数的共现数组A。例如，参考表2中所示，可将用户号码和充值号码联合作为索引，构建共现数组。需要说明的是，为了节省存储空间，共现数组中只存储实际存在充值行为的用户号码以及充值号码的组合。

	数量
用户号码1_充值号码1	2
用户号码1_充值号码2	1
用户号码2_充值号码3	2
用户号码3_充值号码3	2
……	……

表2

在得到共现数组A之后，可以利用networkx构建一个空的图模型。例如可以通过以下代码构建图模型：

def createGraph(A,V):

G＝nx.Graph()#建立一个空的图

G.add_nodes_from(V)#从v中添加节点

for edge in zip(A.index,A['cnt']):

nodes＝edge[0][:].split('_')

node1＝nodes[0]

node2＝nodes[1]

G.add_edges_from(node1,node2,weight＝edge[1])

return G

在图2的基础上，图模型中的边权重可以暂时设置为用户号码与充值号码的共现次数。通过步骤S221以及步骤S222中的方法建立图模型之后，可以可视化网络结构图，例如调用networkx的接口对图模型进行可视化。当图模型中的节点数目过多时，画图渲染所需时间会过长。这时候需要其他可视化工具，如pm大型可视化工具对图模型进行可视化处理。当然也可以不可视化网络结构图，可以根据实际需求而设置。

需要补充的是，还可以采用银行卡预留手机号与充值手机号的关系进行构图；或者采用用户手机号、银行卡预留手机号、充值手机号的关系网构图，可根据用户实际需求和应用场景而进行设置。

在构建图模型之后，可确定所述图模型中包含的每个节点的初始置信度。图模型中包括的节点包括但不限于多个用户号码以及多个充值号码。对于每一个节点而言，可确定其初始置信度。置信度指的是特定个体对待特定命题真实性相信的程度，即概率。每个节点的初始置信度指的是每个节点涉黑的初始概率。

本示例中，确定每个节点的初始置信度的过程如图3中所示，可以包括步骤S310至步骤S330：

在步骤S310中，根据多个用户的置信分数据以及历史参考号码，构建所述多个用户的置信数据集。

在本步骤中，多个用户中的每个用户的置信分数据，即置信分数数据包括但不限于表3中所示。历史参考号码可以是存储在涉黑案件库中的所有涉黑号码，该涉黑号码可以是历史欺诈案件中的涉案手机号。根据多个用户对应的置信分数据以及存储在涉黑案件库中的所有涉黑号码，可构建表3中所示的针对每个用户的置信数据集。

历史参考号码还可以是存储在涉黑案件库中的部分涉黑号码，该涉黑案件库中的涉黑号码可以是已知的全球范围内的涉黑号码，而部分涉黑号码可以是某个地区内的涉黑号码，本公开实施例对此不做限定。

表3

在步骤S320中，基于所述置信数据集对一置信度预测函数进行训练，得到训练好的置信度预测函数。

在步骤S310中建立的置信数据集的基础上，可以通过置信数据集中的数据对一个置信度预测函数进行训练。在一种可能实现方式中，置信度预测函数可以为分类器函数，可采用softmax对其进行训练，以使置信度预测函数性能最优，从而得到训练好的置信度预测函数。训练好的置信度预测函数中，得到的参数为W _b。

在步骤S330中，根据训练好的置信度预测函数对每个用户进行预测，确定每个用户对应的每个节点的所述初始置信度。

在步骤S320的基础上，可以将每个用户的每个历史订单数据输入训练好的置信度预测函数，进而根据参数为W _b的置信度预测函数确定历史订单数据中的用户号码以及充值号码对应的初始置信度。通过本示例性实施例中的方法，能够根据置信数据集训练比较准确的置信度预设函数，进而得到准确的初始置信度。

在步骤S120中，通过所述订单数据得到针对所述用户的社区特征以及综合特征。

本示例性实施例中，社区特征用于描述用户的社交关系，在生成社区特征时，可以采用以下步骤：第一步，构建MRF图模型，构图步骤与图2中所示的相同，此处不再赘述。第二步，利用渗透算法对图模型进行处理得到团集合，其中团集合用于描述多个节点属于的社区，处于一个团集合的节点属于同一个社区。

团渗透算法clique的基本思想在于：对于一个MRF图而言，如果其中有一个完全子图(任意两个节点之间均存在边)，节点数是k，那么这个完全子图就可称为一个k-clique。进而，如果两个k-clique之间存在k-1个共同的节点，那么就称这两个clique是“相邻”的。彼此相邻的这样一串clique构成最大集合，就可以称为一个社区。其中，完全子图包括至少两个节点，且任意两个节点之间均存在边。

本示例性实施例中，利用团渗透算法得到的团集合例如可以为：[(‘手机号1’，‘手机号2’，‘手机号3’),(‘手机号3’，‘手机号4’，‘手机号5’),…]。需要注意的是，每一个团集合汇总包括的节点数k可手动调节，k确定了当有多少个节点生成的完全子图相邻时，可以作为一个社区。例如一个团集合中可包括3个或者是5个节点等等。

第三步，根据团集合与历史参考号码对用户的置信数据集进行标注，得到社区特征。历史参考号码指的是涉黑案件库中的涉黑号码，用户的置信数据集指的是表3中所示的用户的多种置信分数据。对用户的置信数据集进行标注指的是为每一个置信数据集中的数据添加标签。在进行标注时，可标注与用户号码距离最近的团的中心到用户号码的最短距离minDistToClosetsClique，该最短距离即图上的边数。还可以标注用户号码所在的团中，涉黑号码比率fraudMobileCntInCliqueRatio。若用户不在团中，则将用户号码所在团中涉黑号码的比率设置为-1。另外，还可以标注充值号码在用户所在的团中的数目/充值号码数目chargeMobileCntInCliqueRatio。若用户不在团中，将用户号码所在团中中的数目/充值号码数目设置为-1。在标注完这些数据后，可以得到针对用户的的社区特征，进一步可将社区特征添加至表3所示的置信数据集中，以对置信数据集进行更新。除此之外，社区特征中还可以包括社区大小以及社区密度等特征，使用哪些社区特征可根据实际场景进行确定。

除此之外，还可以获得针对用户的综合特征。此处的综合特征用于综合描述至少一个维度特征，至少一个维度特征包括但不限于年龄特征、实时消费特征、地理特征以及消费业务特征中的一种或多种。在本示例性实施例的手机充值涉黑的应用场景中，为了更全面地考虑用户的个人习惯以及年龄等因素的影响，以至少一个维度特征为年龄习惯特征和实时消费特征为例进行说明。

为了使得预测结果更准确，可将年龄习惯特征和实时消费特征均转化为一个综合特征来描述，该综合特征例如可以为风险等级特征。在一种可能实现方式中，可通过对至少一个维度特征的数据进行聚类，得到风险等级特征。在聚类时，可采用kmeans聚类算法，也可以采用K-MEDOIDS算法、CLARANS算法、以及DBSCAN算法、OPTICS算法、DENCLUE算法等任意合适的聚类算法。由于年龄越大的人，使用手机支付的频率更低；青年和中年的活跃时段有所不同，因此可依据此类认知对支付风险评级得到风险等级特征。

举例而言，若对用户年龄、用户一天内的订单数目、用户一天内的总充值金额进行聚类，其聚类中心为[年龄段中心，充值订单数目分段中心，充值金额分段中心]，得到的风险等级特征即为一天内，不同年龄段的人，充值订单数目m比，总充值交易额n时的风险等级。需要说明的是，用户所在的年龄段中心值越大或者越小，所在类中心的订单数越多、充值金额越大，风险等级越高。

若对用户年龄、用户一天24小时内每个小时的订单数目进行聚类，其聚类中心为[年龄段中心，活跃时段中心]，得到的风险等级特征为一天内不同年龄段的人，活跃时发生的交易的风险等级。用户所在的类中心，年龄段中心越大或者越小，充值时间段中心越处于休息时间，风险等级越高。

对于实时消费特征而言，其描述用户的充值消费频率和频次。可将小额、高频次的行为作为危险推断依据，给出风险评判等级。若对用户过去一小时内充值请求数目以及用户过去一小时内总共充值的金额进行聚类，其聚类中心为[充值请求数分段中心，充值金额分段中心]，得到的风险等级特征为从当前订单的时间起过去一小时内，用户发出的充值订单的危险等级。用户所在的类中心的充值请求数越大，充值金额越大，风险等级越高。

需要说明的是，在得到用户的综合特征之后，可以将综合特征添加至表3所示的置信数据集中，以对置信数据集进行更新。

此外，若在业务套现等其他反欺诈场景中，还可以通过地理特征以及消费业务种类偏好等特征描述用户的行为。本示例性实施例中，通过社区特征和综合特征，可以增加描述用户的订单数据的维度，从而从多个维度全面描述用户的充值行为。如此一来，可避免单特征描述用户充值行为时造成的偏差，从而提高准确率。另外，利用用户充值号码的关系网，针对不同用户的社交特性与消费特征，完成个性化的反欺诈识别。

在步骤S130中，通过所述社区特征、所述综合特征、所述初始置信度以及消息更新规则确定所述图模型的消息值，根据所述消息值确定所述图模型，并通过所述图模型计算当前行为对应的订单数据的置信度，以根据所述置信度确定所述当前行为的识别结果。

本示例性实施例中，消息主要用于描述MRF图模型中，局部节点之间的互相影响。设定消息，即设定局部节点之间互相影响的规则，即消息更新规则，主要是确定图模型中局部节点间置信度的转移更新公式。本步骤中确定图模型时使用的消息值为对初始消息值经过优化后得到的目标消息值，其中，初始消息值指的是图模型的初始边权重，目标消息值指的是图模型的目标边权重，例如可以为优化后的或者是训练后的边权重。消息更新规则可例如公式(1)所示：

其中，X为从用户的历史行为关联的订单数据中抽取的综合特征，特征权重W _k由logistic算法训练决定。P为k的取值范围中的最大值，P＝3。k＝1表示充值手机号是账户手机号的状态；k＝2表示充值手机号不是账户手机号，但是充值手机号是否涉黑不明的状态；k＝3表示充值手机号不是账户手机号，但是充值手机号涉黑的状态。V _iu表示用户手机号，V _jc表示充值手机号。W _kViuVjc指的是状态k下，由节点V _iu到节点V _jc的权重值。X _kViuVjc指的是状态k下，由节点V _iu到节点V _jc的特征值。ψ _iu，jc(V _iu，V _jc)为节点V _iu到节点V _jc的边权重。

其中，消息值指的是图模型的边权重，根据消息值确定图模型是指，根据消息值确定根据订单数据构建的图模型的边权重，使得图模型中的信息更加丰富。

通过所述社区特征、所述综合特征、所述初始置信度以及消息更新规则确定所述图模型的消息值时，其中确定初始消息值的过程如图4中所示，可以包括步骤S410至步骤S430。

在步骤S410中，根据所述社区特征和所述综合特征生成权重训练数据。

在本步骤中，可以对社区特征和综合特征进行整理，生成权重训练数据，并用X表示。其中，整理得到的权重训练数据可以包括以下特征：X1，与用户号码距离最近的团，其中心到用户号码的最短距离。X2，用户号码所在的团中，涉黑号码比率。若用户不在团中，将X2设置为-1。X3，用户充值号码在用户所在的团中的数目/用户充值的手机数目。若用户不在团中，将X3设置为-1。X4，一天内，不同年龄段的人，充值订单数目m比，总充值交易额n时的风险等级。X5，一天内，不同年龄段的人，活跃时发生的交易的风险等级。X6，从当前订单的时间起，计一小时内，用户发出的充值订单的危险等级。X7，从当前订单的时间起，计5分钟内，用户发出的充值订单的危险等级。

在步骤S420中，分别对所述权重训练数据以及所述置信数据集进行训练，得到多个权重系数。

置信数据集可以如表3所示，训练的置信数据集表3中所示的用户充值交易分布的置信度，可包括表示用户历史订单数据中，充值号码等于绑定号码的订单占比label1。表示用户历史订单数据中，充值号码不等于绑定号码，但充值号码不涉黑的(不涉黑不一定是安全的手机号)订单占比label2。表示用户历史订单数据中，充值号码不等于绑定号码，但充值号码是涉黑号码的订单占比label3。

多个权重系数指的是分别针对label1、label2以及label3的权重系数，通过将每个权重系数代入上述公式(1)，可得到分别针对label1、label2以及label3的初始消息值。可以采用不同的机器学习算法分别对权重训练数据以及不同的用户充值交易分布的置信度进行训练，以得到多个权重系数。例如，可以采用(X，label1)以及Lasso回归算法对回归模型进行训练，得到训练好的回归模型对应的权重系数W ₁。采用(X，label2)以及包括tanh核的支持向量机算法对支持向量机模型进行训练，得到训练好的支持向量机模型对应的权重系数W ₂。采用(X，label3)以及包括线性核的支持向量机算法对支持向量机模型进行训练，得到训练好的支持向量机模型对应的权重系数W ₃。除此之外，还可以对岭逻辑回归模型、逻辑回归模型、不同核函数下的支持向量机模型等机器学习模型进行训练，得到权重系数，本示例中对此不作特殊限定。

在步骤S430中，将所述多个权重系数以及所述综合特征输入所述消息更新规则，得到所述图模型的初始消息值。

在步骤S420的基础上，分别将针对label1、label2以及label3的权重系数以及对应的综合特征X代入上述公式(1)，从而可得到图模型的初始消息值，即初始边权重。

在根据一组参数(β _c,W _b,W)得到初始消息值之后，可对初始消息值进行更新以得到目标消息值。该组参数中，β _c指的是充值号码节点的置信度，例如可以为[0.5,0.5]。W _b,W是采用多次随机采样下与交叉验证得到的值，W _b指的是计算初始置信度的训练好的置信度预测函数的系数，W指的是权重参数。目标消息值指的是比较稳定、性能较好的图模型的边权重。

在得到初始消息值之后，为了使得计算结果更准确，可对初始消息值进行优化和更新，以根据初始消息值得到目标消息值。在对初始消息值进行更新时，可对步骤S221中的用于描述多个用户号码与多个充值号码共同出现的次数的共现矩阵进行更新，在一种可能实现方式中，可将共现矩阵中各节点的共现频次更新为消息值，即消息值由共现次数更新为共现频次。在更新共现矩阵E之后，可利用python包中的pgmpy代码构建图模型，图模型中的边权重为共现频次。

对初始消息值进行优化得到图模型的目标消息值的具体过程如图5所示，包括步骤S510至步骤S530：

在步骤S510中，通过所述初始消息值计算所述充值号码满足预设条件的置信度。其中，预设条件指的是最终要判断的条件，例如可以为涉黑条件，充值号码满足预设条件指的是充值号码涉黑。可采用置信度传播算法确定充值号码涉黑的置信度。置信度传播算法利用节点与节点之间相互传递信息而更新当前整个MRF的标记状态，经过多次迭代后，所有节点的信度不再发生变化，就称此时每一个节点的标记即为最优标记，MRF也达到了收敛状态。

在通过置信度传播后，可以确定图模型的多条边中每个边的边权重，对于每一个节点代表的充值号码或用户号码而言，可通过节点连接的所有边的边权重确定该节点的置信度I _C。例如，对于充值号码1而言，如有4个节点与其相连，且已知节点1与充值号码1之间的边权重为a，节点2与充值号码1之间的边权重为b，节点3与充值号码1之间的边权重为c，节点4与充值号码1之间的边权重为d，且a+b+c+d等于1。则对于充值号码1而言，其置信度为这四条边的边权重之积，即a*b*c*d。通过置信度传播算法，可减小数据计算量，从而提升计算效率。

在步骤S520中，计算所有满足预设条件的充值号码的置信度损失。置信度损失函数如公式(2)所示：

其中，t为涉黑库中某一个涉黑号码的索引，T为涉黑库中涉黑号码的总数量，R _ct为真实的涉黑标签(如果涉黑置1，反之置0)，I _ct为预测的充值号码涉黑的置信度。通过上述公式(2)可计算历史订单数据中包含的所有充值号码的置信度损失。

在步骤S530中，通过将所述置信度损失最小化对所述初始消息值进行优化，得到所述目标消息值。

在本步骤中，可以对置信度损失进行最小化，在一种可能实现方式中，可如公式(3)所示：

也就是说，可多次迭代更新消息值、根据消息值计算充值号码涉黑的置信度以及计算充值号码涉黑的置信度损失三个步骤，直至置信度损失最小时停止迭代过程，得到最优的参数(β _c,W _b,W)其中，β _c指的是充值号码节点的置信度，W _b指的是计算初始置信度的训练好的置信度预测函数的系数，W指的是权重参数。如此一来，可通过将置信度损失最小化得到最优参数，从而使得计算的充值号码的置信度更准确。另外，在待优化参数比较多时，还可以采用贪心算法进行迭代，从而加快处理速度。在置信度损失最小时，即可以将初始消息值优化为目标消息值。

通过确定的社区特征以及综合特征、初始置信度、消息更新规则确定初始消息值，可基于用户的历史置信度计算初始消息值，提供了相对全面的用户先验信息，能够使计算的初始消息值更准确，更全面。进一步地，通过置信度损失最小化确定最优参数，从而根据最优参数确定目标消息值，能够使得到的图模型目标消息值，即图模型的边权重更准确。

本示例性实施例中，可通过优化后得到的目标消息值确定图模型，使得该图模型的性能更稳定。在一种可能实现方式中，可根据最优的参数(β _c,W _b,W)重新计算目标消息值，并根据目标消息值更新共现矩阵，将共现矩阵中各节点的共现频次更新为目标消息值，即生成图模型中的边权重。进一步地，针对各节点的共现频次更新为目标消息值的共现矩阵E，利用python包中的pgmpy函数构建图模型，进而根据图模型计算当前行为对应的订单数据的置信度I _C。当前行为指的是当前的充值行为，订单数据指的是当前的充值行为包括的充值订单数据，且当前充值请求对应的订单数据可以为至少一个。计算置信度可以为根据图模型确定订单数据中包含的充值号码的置信度。根据性能稳定的图模型计算充值号码的置信度，可以使得计算的置信度更准确，从而更精准的识别用户充值行为，及时高效地进行充值反欺诈。

需要补充的是，由于用户的社交关系、置信分值随着交易的发生有变动的可能性，所以可以每隔预设周期执行上述步骤S110至步骤S130，完成对用户信息的实时更新，从而重新确定图模型，以确保图模型的准确性。

此外，本示例性实施例中，所述方法还包括：对所述置信度大于预设值的订单数据进行预警。预设值可以根据实际精度要求进行设置，例如可以设置为0.7或0.8等等。举例而言，若通过步骤S130中计算得到订单数据1中包括的充值号码的置信度为0.9，则可以筛选出订单数据1。在筛选出订单数据1的同时，可进行预警。进行预警的方式例如包括生成一个提示信息，提示信息中可包括描述订单数据1的订单编号或其他信息。进一步地，可将提示信息发送监管部门，监管部门在接收到表示预警的提示信息之后，可对该订单数据再次进行查验审核。通过对置信度大于预设值的订单数据进行预警，可自动识别充值欺诈行为，提高反欺诈监控的准确性和高效性。

由于常见的手机充值反欺诈方案中，一般根据用户的账户信息、行为特点等实时信息，判断用户当前的充值请求是否是欺诈行为，因此输入的数据都是单一特征数据，通过单一数据构建的图模型不能准确全面识别用户行为是否为欺诈行为。另外，仅根据历史数据构建模型对充值行为进行识别，由于历史数据并不准确，因此不能准确识别用户行为，不能及时避免欺诈风险。

而本公开示例性实施例中提供的行为识别方法，一方面，通过历史行为对应的订单数据得到针对用户的社区特征以及综合特征，增加了特征描述维度，避免了单一特征造成的误差，提高了准确率；一方面，通过社区特征、综合特征、初始置信度以及消息更新规则确定图模型的消息值进而根据消息值构建图模型，能够得到准确的消息值并且能够构建准确的图模型；另一方面，通过得到的图模型计算当前行为对应的订单数据的置信度，从而可以根据置信度快速准确地进行用户行为识别，及时避免欺诈风险。

本公开还提供了一种行为识别装置。参考图6所示，该行为识别装置600可以包括：

置信度计算模块601，用于基于用户的历史行为对应的订单数据构建图模型，并确定所述图模型中包含的每个节点的初始置信度；

特征提取模块602，用于通过所述订单数据得到针对所述用户的社区特征以及综合特征；

识别控制模块603，用于通过所述社区特征、所述综合特征、所述初始置信度以及消息更新规则确定所述图模型的消息值，根据所述消息值确定所述图模型，并通过所述图模型计算当前行为对应的订单数据的置信度，以根据所述置信度确定所述当前行为的识别结果。

需要说明的是，上述行为识别装置中各模块的细节已经在对应的行为识别方法中进行了详细描述，因此此处不再赘述。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外，尽管在附图中以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

在本公开的示例性实施例中，还提供了一种能够实现上述方法的电子设备。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

下面参照图7来描述根据本发明的这种实施方式的电子设备700。图7显示的电子设备700仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图7所示，电子设备700以通用计算设备的形式表现。电子设备700的组件可以包括但不限于：上述至少一个处理单元710、上述至少一个存储单元720、连接不同系统组件(包括存储单元720和处理单元710)的总线730。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元710执行，使得所述处理单元710执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如，所述处理单元710可以执行如图1中所示的步骤。

存储单元720可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)7201和/或高速缓存存储单元7202，还可以进一步包括只读存储单元(ROM)7203。

存储单元720还可以包括具有一组(至少一个)程序模块7205的程序/实用工具7204，这样的程序模块7205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线730可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

显示单元740可以为具有显示功能的显示器，以通过该显示器展示由处理单元710执行本示例性实施例中的方法而得到的处理结果。显示器包括但不限于液晶显示器或者是其它显示器。

电子设备700也可以与一个或多个外部设备900(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备700交互的设备通信，和/或与使得该电子设备700能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口750进行。并且，电子设备700还可以通过网络适配器760与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器760通过总线730与电子设备700的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备700使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

在本公开的示例性实施例中，还提供了一种电子设备，该电子设备包括：处理器；以及存储器，用于存储该处理器的可执行指令；

其中，该处理器配置为：

基于用户的历史行为对应的订单数据构建图模型，并确定该图模型中包含的每个节点的初始置信度；

通过该订单数据得到针对该用户的社区特征以及综合特征；

通过该社区特征、该综合特征、该初始置信度以及消息更新规则确定该图模型的消息值，根据该消息值确定该图模型，并通过该图模型计算当前行为对应的订单数据的置信度，以根据该置信度确定该当前行为的识别结果。

在本公开的示例性实施例中，该处理器还被配置为：

获取该历史行为对应的订单数据，该订单数据中包括与该用户关联的用户号码以及充值号码；

基于该用户号码与该充值号码之间的关联关系，构建该图模型。

在本公开的示例性实施例中，该处理器还被配置为：

按照该用户号码进行分组，构建该用户号码与该充值号码的共现矩阵，并根据该共现矩阵构建该图模型；或

将该用户号码以及该充值号码联合作为索引构建共现数组，并根据该共现数组构建该图模型。

在本公开的示例性实施例中，该处理器还被配置为：

根据多个用户的置信分数据以及历史参考号码，构建该多个用户的置信数据集；

基于该置信数据集对一置信度预测函数进行训练，得到训练好的置信度预测函数；

根据训练好的置信度预测函数对每个用户进行预测，确定每个用户对应的每个节点的该初始置信度。

在本公开的示例性实施例中，该处理器还被配置为：

基于该订单数据构建该图模型；

利用渗透算法对该图模型进行处理，得到团集合；

根据该团集合与历史参考号码对用户的置信数据集进行标注，以得到该社区特征。

在本公开的示例性实施例中，该处理器还被配置为：

获取针对该用户的至少一个维度特征的数据，并对该至少一个维度特征的数据进行聚类，得到该综合特征。

在本公开的示例性实施例中，该至少一个维度特征包括年龄习惯特征、实时消费特征、地理特征以及消费业务特征中的一种或多种，该综合特征包括风险等级特征。

在本公开的示例性实施例中，该处理器还被配置为：

根据该社区特征和该综合特征生成权重训练数据；

分别对该权重训练数据以及该置信数据集进行训练，得到多个权重系数；

将该多个权重系数以及该综合特征输入该消息更新规则，得到该图模型的初始消息值。

在本公开的示例性实施例中，该处理器还被配置为：

更新该共现矩阵，并根据该共现矩阵中各节点的共现频次对该初始消息值进行更新，得到该图模型的目标消息值。

在本公开的示例性实施例中，该处理器还被配置为：

通过该初始消息值计算该充值号码满足预设条件的置信度；

计算所有满足预设条件的充值号码的置信度损失；

通过将该置信度损失最小化对该初始消息值进行优化，得到该目标消息值。

在本公开的示例性实施例中，该处理器还被配置为：

针对该共现矩阵以及该目标消息值，生成该图模型。

在本公开的示例性实施例中，该处理器还被配置为：

对该置信度大于预设值的订单数据进行预警。

在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。

参考图8所示，描述了根据本发明的实施方式的用于实现上述方法的程序产品800，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现：

通过该订单数据得到针对该用户的社区特征以及综合特征；

在本公开的示例性实施例中，该计算机程序被处理器执行时实现：

基于该订单数据构建该图模型；

利用渗透算法对该图模型进行处理，得到团集合；

根据该社区特征和该综合特征生成权重训练数据；

通过该初始消息值计算该充值号码满足预设条件的置信度；

计算所有满足预设条件的充值号码的置信度损失；

针对该共现矩阵以及该目标消息值，生成该图模型。

对该置信度大于预设值的订单数据进行预警。

此外，上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

Claims

一种行为识别方法，包括：

基于用户的历史行为对应的订单数据构建图模型，并确定所述图模型中包含的每个节点的初始置信度；

通过所述订单数据得到针对所述用户的社区特征以及综合特征；

通过所述社区特征、所述综合特征、所述初始置信度以及消息更新规则确定所述图模型的消息值，根据所述消息值确定所述图模型，并通过所述图模型计算当前行为对应的订单数据的置信度，以根据所述置信度确定所述当前行为的识别结果。
根据权利要求1所述的行为识别方法，基于用户的历史行为对应的订单数据构建图模型包括：

获取所述历史行为对应的订单数据，所述订单数据中包括与所述用户关联的用户号码以及充值号码；

基于所述用户号码与所述充值号码之间的关联关系，构建所述图模型。
根据权利要求2所述的行为识别方法，基于所述用户号码与所述充值号码之间的关联关系，构建所述图模型包括：

按照所述用户号码进行分组，构建所述用户号码与所述充值号码的共现矩阵，并根据所述共现矩阵构建所述图模型；或

将所述用户号码以及所述充值号码联合作为索引构建共现数组，并根据所述共现数组构建所述图模型。
根据权利要求1所述的行为识别方法，确定所述图模型中包含的每个节点的初始置信度包括：

根据多个用户的置信分数据以及历史参考号码，构建所述多个用户的置信数据集；

基于所述置信数据集对一置信度预测函数进行训练，得到训练好的置信度预测函数；

根据训练好的置信度预测函数对每个用户进行预测，确定每个用户对应的每个节点的所述初始置信度。
根据权利要求4所述的行为识别方法，通过所述订单数据得到针对所述用户的社区特征以及综合特征包括：

利用渗透算法对所述图模型进行处理，得到团集合；

根据所述团集合与历史参考号码对用户的置信数据集进行标注，以得到所述社区特征。
根据权利要求1所述的行为识别方法，通过所述订单数据得到针对所述用户的社区特征以及综合特征包括：

获取针对所述用户的至少一个维度特征的数据，并对所述至少一个维度特征的数据进行聚类，得到所述综合特征。
根据权利要求6所述的行为识别方法，所述至少一个维度特征包括年龄习惯特征、实时消费特征、地理特征以及消费业务特征中的一种或多种，所述综合特征包括风险等级特征。
根据权利要求3所述的行为识别方法，通过所述社区特征、所述综合特征、所述初始置信度以及消息更新规则确定所述图模型的消息值包括：

根据所述社区特征和所述综合特征生成权重训练数据；

分别对所述权重训练数据以及置信数据集进行训练，得到多个权重系数；

将所述多个权重系数以及所述综合特征输入所述消息更新规则，得到所述图模型的初始消息值。
根据权利要求8所述的行为识别方法，所述方法还包括：

更新所述共现矩阵，并根据所述共现矩阵中各节点的共现频次对所述初始消息值进行更新，得到所述图模型的目标消息值。
根据权利要求9所述的行为识别方法，根据所述共现矩阵中各节点的共现频次对所述初始消息值进行更新，得到所述图模型的目标消息值包括：

通过所述初始消息值计算所述充值号码满足预设条件的置信度；

计算所有满足预设条件的充值号码的置信度损失；

通过将所述置信度损失最小化对所述初始消息值进行优化，得到所述目标消息值。
根据权利要求9所述的行为识别方法，根据所述消息值确定所述图模型包括：

针对所述共现矩阵以及所述目标消息值，生成所述图模型。
根据权利要求1所述的行为识别方法，所述方法还包括：

对所述置信度大于预设值的订单数据进行预警。
一种行为识别装置，其特征在于，包括：

置信度计算模块，用于基于用户的历史行为对应的订单数据构建图模型，并确定所述图模型中包含的每个节点的初始置信度；

特征提取模块，用于通过所述订单数据得到针对所述用户的社区特征以及综合特征；

识别控制模块，用于通过所述社区特征、所述综合特征、所述初始置信度以及消息更新规则确定所述图模型的消息值，根据所述消息值确定所述图模型，并通过所述图模型计算当前行为对应的订单数据的置信度，以根据所述置信度确定所述当前行为的识别结果。
一种电子设备，包括：

处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为：

基于用户的历史行为对应的订单数据构建图模型，并确定所述图模型中包含的每个节点的初始置信度；

通过所述订单数据得到针对所述用户的社区特征以及综合特征；

通过所述社区特征、所述综合特征、所述初始置信度以及消息更新规则确定所述图模型的消息值，根据所述消息值确定所述图模型，并通过所述图模型计算当前行为对应的订单数据的置信度，以根据所述置信度确定所述当前行为的识别结果。
根据权利要求14所述的电子设备，所述处理器还被配置为：

获取所述历史行为对应的订单数据，所述订单数据中包括与所述用户关联的用户号码以及充值号码；

基于所述用户号码与所述充值号码之间的关联关系，构建所述图模型。
根据权利要求15所述的电子设备，所述处理器还被配置为：

按照所述用户号码进行分组，构建所述用户号码与所述充值号码的共现矩阵，并根据所述共现矩阵构建所述图模型；或

将所述用户号码以及所述充值号码联合作为索引构建共现数组，并根据所述共现数组构建所述图模型。
根据权利要求14所述的电子设备，所述处理器还被配置为：

根据多个用户的置信分数据以及历史参考号码，构建所述多个用户的置信数据集；

基于所述置信数据集对一置信度预测函数进行训练，得到训练好的置信度预测函数；

根据训练好的置信度预测函数对每个用户进行预测，确定每个用户对应的每个节点的所述初始置信度。
根据权利要求17所述的电子设备，所述处理器还被配置为：

基于所述订单数据构建所述图模型；

利用渗透算法对所述图模型进行处理，得到团集合；

根据所述团集合与历史参考号码对用户的置信数据集进行标注，以得到所述社区特征。
根据权利要求14所述的电子设备，所述处理器还被配置为：

获取针对所述用户的至少一个维度特征的数据，并对所述至少一个维度特征的数据进行聚类，得到所述综合特征。
根据权利要求19所述的电子设备，所述至少一个维度特征包括年龄习惯特征、实时消费特征、地理特征以及消费业务特征中的一种或多种，所述综合特征包括风险等级特征。
根据权利要求16所述的电子设备，所述处理器还被配置为：

根据所述社区特征和所述综合特征生成权重训练数据；

分别对所述权重训练数据以及置信数据集进行训练，得到多个权重系数；

将所述多个权重系数以及所述综合特征输入所述消息更新规则，得到所述图模型的初始消息值。
根据权利要求21所述的电子设备，所述处理器还被配置为：

更新所述共现矩阵，并根据所述共现矩阵中各节点的共现频次对所述初始消息值进行更新，得到所述图模型的目标消息值。
根据权利要求22所述的电子设备，所述处理器还被配置为：

通过所述初始消息值计算所述充值号码满足预设条件的置信度；

计算所有满足预设条件的充值号码的置信度损失；

通过将所述置信度损失最小化对所述初始消息值进行优化，得到所述目标消息值。
根据权利要求22所述的电子设备，所述处理器还被配置为：

针对所述共现矩阵以及所述目标消息值，生成所述图模型。
根据权利要求14所述的电子设备，所述处理器还被配置为：

对所述置信度大于预设值的订单数据进行预警。
一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-12任意一项所述的行为识别方法。