CN115730823A - 风险概率识别方法、装置、处理器和电子设备 - Google Patents

风险概率识别方法、装置、处理器和电子设备 Download PDF

Info

Publication number
CN115730823A
CN115730823A CN202211476079.6A CN202211476079A CN115730823A CN 115730823 A CN115730823 A CN 115730823A CN 202211476079 A CN202211476079 A CN 202211476079A CN 115730823 A CN115730823 A CN 115730823A
Authority
CN
China
Prior art keywords
data
nodes
network model
target
target data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211476079.6A
Other languages
English (en)
Inventor
崔际宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202211476079.6A priority Critical patent/CN115730823A/zh
Publication of CN115730823A publication Critical patent/CN115730823A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种风险概率识别方法、装置、处理器和电子设备。涉及人工智能领域,该方法包括:确定N个目标数据,其中,N个目标数据包括设备数据,N个目标数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的行为信息,N为大于1的整数;根据N个目标数据,生成目标结构图,其中,N个节点分别表征N个目标数据,N个节点之间的边分别表征N个目标数据之间的交互行为;将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率。本发明解决了相关技术中对金融机构账户进行风险预测时的存在预测结果不准确的问题。

Description

风险概率识别方法、装置、处理器和电子设备
技术领域
本发明涉及人工智能领域,具体而言,涉及一种风险概率识别方法、装置、处理器和电子设备。
背景技术
现在在金融机构业内实施的风险概率识别方法主要有两类,一类是基于专家规则的风险概率识别方法,即当进行交易的金融机构账户满足一些条件时自动确认该账户风险概率高,并对该账户进行控制。另一类为基于人工智能的风险概率识别方法,主要应用决策树模型对交易特征、客户信息特征等特征进行预训练,每日日终将当日交易账户输入模型进行预测判断风险。
现有技术考虑了账户之间的交互信息,对账户的风险概率进行预测,但是通过这样的预测方式给出账户风险概率的识别效果一般,模型的准确率和召回率都较低。
针对相关技术中对金融机构账户进行风险预测时的存在预测结果不准确的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种风险概率识别方法、装置、处理器和电子设备,以至少解决相关技术中对金融机构账户进行风险预测时的存在预测结果不准确的技术问题。
为了实现上述目的,根据本申请的一个方面,提供了一种风险概率识别方法。该方法包括:确定N个目标数据,其中,N个目标数据包括设备数据,N个目标数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的行为信息,N为大于1的整数;根据N个目标数据,生成目标结构图,其中,目标结构图包括N个节点和N个节点之间的边,N个节点分别表征N个目标数据,N个节点各自的节点属性分别由N个目标数据各自的属性信息确定,N个节点之间的边分别表征N个目标数据之间的交互行为,N个节点之间的边的边属性由行为信息确定;将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率。
可选地,将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率,包括:将目标结构图输入图卷积网络单元,由图卷积网络单元输出与N个节点一一对应的N个嵌入式表达,其中,关系图卷积网络模型包括图卷积网络单元,N个嵌入式表达分别表征N个目标节点的特征信息;将N个嵌入式表达输入矩阵运算单元,由矩阵运算单元输出与N个目标数据一一对应的N个风险概率,其中,关系图卷积网络模型包括矩阵运算单元。
可选地,将N个嵌入式表达输入矩阵运算单元,由矩阵运算单元输出与N个目标数据一一对应的N个风险概率,包括:将N个嵌入式表达输入矩阵运算单元,由矩阵运算单元根据N个嵌入式表达分别对应的N个节点对应的对象类型,确定N个嵌入式表达各自对应的矩阵;将N个嵌入式表达与N个嵌入式表达各自对应的矩阵分别相乘,由矩阵运算单元输出与N个目标数据一一对应的N个风险概率。
可选地,将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率,包括:将目标结构图输入图卷积网络单元,由图卷积网络单元输出与N个节点一一对应的N个嵌入式表达,其中,关系图卷积网络模型包括图卷积网络单元,N个嵌入式表达分别表征N个目标节点的特征信息;将N个嵌入式表达输入神经网络模型单元,由神经网络模型单元输出与N个目标数据一一对应的N个风险概率,其中,关系图卷积网络模型包括神经网络模型单元,神经网络模型单元中包括神经网络模型,神经网络模型用于将输入的嵌入式表达转化为风险概率输出。
可选地,关系图卷积网络模型为通过如下方式训练得到的模型,包括:获取L个样本数据和与L个样本数据分别对应的L个风险信息,其中,L个样本数据包括设备数据,L个样本数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的样本行为信息,L个风险信息分别表征L个样本数据的风险状态,L为大于1的整数;根据L个样本数据,生成样本结构图,其中,样本结构图包括L个节点和L个节点之间的边,L个节点分别表征L个样本数据,L个节点各自的节点属性分别由L个样本对象的样本属性信息确定,L个节点之间的边分别表征L个样本数据之间的交互行为,L个节点之间的边的边属性由样本行为信息确定;将样本结构图输入原始神经网络模型,并根据风险信息训练原始神经网络模型,得到关系图卷积网络模型,其中,原始神经网络模型为关系图卷积网络模型的原始模型。
可选地,根据N个目标数据,生成目标结构图,包括:将N个目标数据确定为N个节点;根据行为信息,确定N个目标数据之间的交互行为为N个节点之间的边,以及确定N个节点之间的边具有的边属性;根据属性信息确定N个节点的节点属性;根据N个节点、N个节点之间的边、N个节点的节点属性和N个节点之间的边具有的边属性,生成目标结构图。
可选地,确定N个目标数据,包括:获取M个对象数据,其中,M个对象数据包括账户数据和设备数据;根据M个对象数据,确定账户数据各自的账户出入度,其中,账户出入度分别表征账户数据的交易频率;将出入度大于预定阈值的账户数据从M个对象数据中删除,将M个对象数据中没有被删除的数据确定为N个目标数据。
为了实现上述目的,根据本申请的另一方面,提供了一种风险概率识别装置。该装置包括:确定模块,用于确定N个目标数据,其中,N个目标数据包括设备数据,N个目标数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的行为信息;生成模块,用于根据N个目标数据,生成目标结构图,其中,目标结构图包括N个节点和N个节点之间的边,N个节点分别表征N个目标数据,N个节点各自的节点属性分别由N个目标数据各自的属性信息确定,N个节点之间的边分别表征N个目标数据之间的交互行为,N个节点之间的边的边属性由行为信息确定;输出模块,用于将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率。
为了实现上述目的,根据本申请的又一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述风险概率识别方法。
为了实现上述目的,根据本申请的再一方面,提供了一种电子设备,电子设备包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任意一项所述风险概率识别方法。
在本发明实施例中,采用以下步骤:确定N个目标数据,其中,N个目标数据包括设备数据,N个目标数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的行为信息;根据N个目标数据,生成目标结构图,其中,目标结构图包括N个节点和N个节点之间的边,N个节点分别表征N个目标数据,N个节点各自的节点属性分别由N个目标数据各自的属性信息确定,N个节点之间的边分别表征N个目标数据之间的交互行为,N个节点之间的边的边属性由行为信息确定;将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率,达到了考虑与交易行为相关的设备数据的目的,解决了相关技术中对金融机构账户进行风险预测时的存在预测结果不准确的问题,进而达到了提升对账户风险预测结果的准确度的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例提供的风险概率识别方法的流程图;
图2是根据本发明可选实施例提供的样本结构图的示意图;
图3是根据本发明可选实施例提供的模型更新训练的流程框图;
图4是根据本发明实施例提供的风险概率识别装置的示意图;
图5是根据本发明实施例提供的用于进行风险概率识别的电子设备的结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
关系图卷积网络(Relational Graph Convolutional Network,简称RGCN),是一种根据知识图谱中局部领域结构化关系信息预测缺失信息的神经网络模型。
需要说明的是,本发明所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。例如,本发明中涉及的设备或系统和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
现有技术考虑了账户之间的交互信息,对账户的风险概率进行预测,但是没有考虑到与交易行为有关的其他对象的属性和行为对账户风险预测的影响,导致现有技术进行的风险概率识别的效果一般。而本发明提出一种考虑了与交易行为有关的其他对象的属性和行为对账户风险预测的影响,下面结合优选的实施步骤对本发明进行说明,图1是根据本发明实施例提供的风险概率识别方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,确定N个目标数据,其中,N个目标数据包括设备数据,N个目标数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的行为信息,N为大于1的整数。
本步骤中,可以确定N个目标数据,N个目标数据中包括多个数据,每一个数据表示一个对象相关的所有信息,这个数据的属性信息即为这个数据表示的对象的属性信息,这个数据的行为信息即为这个数据表示的对象和其他对象之间进行的交互的行为信息。例如,目标数据中可以包括账户数据、用户数据和设备数据;一个账户数据表示了一个账户相关的信息,一个用户数据表示了一个用户相关的信息,一个设备数据表示了一个设备相关的信息,每个目标数据都对应表示一个对象。每个数据中都包括了属性信息和行为信息,这个属性信息为这个目标数据表示的对象的属性,这个行为信息为这个目标数据表示的对象与其他对象之间进行交互的行为信息。
具体地,账户数据的属性信息可以为账户基础信息和账户交易统计信息,其中,账户基础信息可以包括余额、开户地区等信息,账户交易统计信息可以包括账户快进快出,夜间交易、账户交易被拒信息等;用户数据的属性信息可以为用户的持有产品信息和自然信息,其中,自然信息可以包括性别和年龄等;设备数据的属性信息可以为设备异常标签、设备型号、设备状态、设备已安装的应用程序情况等,其中,设备异常标签可以包括更改设备初始设定、安装改机工具等。账户和账户之间的交互的行为可以包括交易行为,交易行为对应的行为信息可以为交易的时间和金额等;账户和用户之间的交互的行为可以为所属行为,所属行为可以为某个账户属于某个用户,所属行为对应的行为信息可以为账户的开户时间,其中,一个账户可以只属于一个用户,一个用户可以有多个账户;账户和设备之间的交互行为可以为登录行为,登录行为对应的行为信息可以包括登录时间和登录次数等;用户和用户之间的交互行为可以为用户之间的关系,比如夫妻关系等;用户和设备之间的交互行为可以为所属关系;设备和设备之间的交互行为可以为相关性关系,比如两个设备同处于同一个局域网下。
步骤S102,根据N个目标数据,生成目标结构图,其中,目标结构图包括N个节点和N个节点之间的边,N个节点分别表征N个目标数据,N个节点各自的节点属性分别由N个目标数据各自的属性信息确定,N个节点之间的边分别表征N个目标数据之间的交互行为,N个节点之间的边的边属性由行为信息确定。
本步骤中,在确定N个目标数据之后,可以将N个目标数据绘制成为目标结构图,目标结构图中包括点和边。图中的每个节点表示一个目标数据,每个节点都具有自身的节点属性,节点属性由节点表示的目标数据的属性信息确定。由于每个目标数据可以表示一个对象,表示的对象可以分为三个类型,所以节点也可以划分为三个不同类型。发生交互行为的两个节点之间连线作为节点之间的边,一条边表示一次交互行为的发生,每条边都具有自身的边属性,边属性由交互行为的行为信息确定。
步骤S103,将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率。
本步骤中,将生成的目标结构图输入预先训练的关系图卷积网络模型后,关系图卷积网络模型可以通过预先学习到的知识,通过目标结构图中已有的信息对每个节点进行风险概率的预测,最终输出每个节点对应的风险概率,也即与每个目标数据对应的风险概率。
通过上述步骤,可以实现考虑与交易行为相关的设备数据的目的,解决了相关技术中对金融机构账户进行风险预测时的存在预测结果不准确的问题,进而达到了提升对账户风险预测结果的精确度的技术效果。
作为一种可选的实施例,将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率,可以通过以下步骤实现:将目标结构图输入图卷积网络单元,由图卷积网络单元输出与N个节点一一对应的N个嵌入式表达,其中,关系图卷积网络模型包括图卷积网络单元,N个嵌入式表达分别表征N个目标节点的特征信息;将N个嵌入式表达输入矩阵运算单元,由矩阵运算单元输出与N个目标数据一一对应的N个风险概率,其中,关系图卷积网络模型包括矩阵运算单元。
可选地,关系图卷积网络模型包括两个部分,一部分为图卷积网络单元,另一部分可以为矩阵运算单元。图卷积网络单元由一个预先训练好的图卷积网络模型组成,在目标结构图输入这个图卷积网络模型后,这个模型会根据图中每个节点所具有的节点属性提取一次特征,即生成一个初始化的嵌入式表达,并可以依据训练时得到的传递函数依次计算每一个节点更新的嵌入式表达,每个节点更新的嵌入式表达可以表示与这个节点相连的节点通过它们之间的交互行为对这个节点产生的影响,图卷积网络模型每一轮都依次计算每一个节点更新的嵌入式表达,最终确定与N个节点一一对应的N个嵌入式表达。N个嵌入式表达可以表示每个节点的风险概率,可以将N个嵌入式表达输入矩阵运算单元,矩阵运算单元可以解码N个嵌入式表达,最终输出N个确定的风险概率,每个风险概率表示与N个节点对应的N个对象的风险概率。
作为一种可选的实施例,将N个嵌入式表达输入矩阵运算单元,由矩阵运算单元输出与N个目标数据一一对应的N个风险概率,可以通过以下步骤实现:将所述N个嵌入式表达输入所述矩阵运算单元,由所述矩阵运算单元根据N个嵌入式表达分别对应的N个节点对应的对象类型,确定N个嵌入式表达各自对应的矩阵;将N个嵌入式表达与N个嵌入式表达各自对应的矩阵分别相乘,由所述矩阵运算单元输出与N个目标数据一一对应的N个风险概率。
可选地,N个嵌入式表达的形式可以为向量形式,矩阵运算单元可以将N个嵌入式表达分别与确定的矩阵相乘,最终得到一个数学结果作为风险概率。由于N个嵌入式表达对应的对象可以有三种类型,所以确定的矩阵可以有三个。矩阵运算单元可以根据嵌入式表达对应的节点的类型确定对应的矩阵,并将嵌入式表达与对应的矩阵相乘即可得到风险概率。例如,某个账户数据对应的节点的嵌入式表达为hi,矩阵运算单元可以判断节点的类型为账户,对应找到账户矩阵,使hi与账户矩阵相乘,得到这个账户对应的风险概率。
作为一种可选的实施例,将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率,可以通过以下步骤实现:将目标结构图输入图卷积网络单元,由图卷积网络单元输出与N个节点一一对应的N个嵌入式表达,其中,关系图卷积网络模型包括图卷积网络单元,N个嵌入式表达分别表征N个目标节点的特征信息;将N个嵌入式表达输入神经网络模型单元,由神经网络模型单元输出与N个目标数据一一对应的N个风险概率,其中,关系图卷积网络模型包括神经网络模型单元,神经网络模型单元中包括神经网络模型,神经网络模型用于将输入的嵌入式表达转化为风险概率输出。
可选地,关系图卷积网络模型可以不包括矩阵运算单元,将矩阵预算单元替换为神经网络模型,也可以实现将嵌入式表达输入神经网络模型,神经网络模型输出对应的风险概率。神经网络模型单元可以为能够实现将输入的嵌入式表达转化为风险概率输出的神经网络模型,具体地,可以是卷积神经网络模型、全连接神经网络或生成对抗网络等,只要选取训练数据对神经网络模型进行训练,就可以使神经网络模型实现将输入的嵌入式表达转化为风险概率输出的技术效果。
作为一种可选的实施例,关系图卷积网络模型可以为通过如下方式训练得到的模型,实现:获取L个样本数据和与L个样本数据分别对应的L个风险信息,其中,L个样本数据包括设备数据,L个样本数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的样本行为信息,L个风险信息分别表征L个样本数据的风险状态,L为大于1的整数;根据L个样本数据,生成样本结构图,其中,样本结构图包括L个节点和L个节点之间的边,L个节点分别表征L个样本数据,L个节点各自的节点属性分别由L个样本对象的样本属性信息确定,L个节点之间的边分别表征L个样本数据之间的交互行为,L个节点之间的边的边属性由样本行为信息确定;将样本结构图输入原始神经网络模型,并根据风险信息训练原始神经网络模型,得到关系图卷积网络模型,其中,原始神经网络模型为关系图卷积网络模型的原始模型。
可选地,在对原始神经网络模型进行训练时,需要先获取L个样本数据和与L个样本数据分别对应的L个风险信息,L个样本数据可以作图得到样本结构图,可以将样本结构图输入原始神经网络模型,并比较原始神经网络模型输出的风险概率和L个风险信息的差距对原始神经网络模型进行调整,使其学习到样本结构图中蕴含的知识。
图2是根据本发明可选实施例提供的样本结构图的示意图,如图2所示,可以为一幅训练时使用的样本结构图,训练时已知图内所有账户、设备和用户的属性信息,结合边属性求得各种交互行为所代表的传递函数
Figure BDA0003960053540000081
其中Pr为交互行为类型r的边属性,hi为节点i的嵌入式表达,l为计算的轮数,对所有节点都计算一遍即为一轮计算。这个传递函数可以是简单的矩阵,也可以是多层神经网络。每一次传播后,节点i的嵌入式表达都会更新:
Figure BDA0003960053540000082
其中R为所有种类的关系的集合,
Figure BDA0003960053540000083
为节点i在关系r上的所有邻居节点集合,
Figure BDA0003960053540000084
为节点i在关系r上的所有邻居节点的数量。训练的目的为经过n代传播之后,所有图内节点的嵌入式表达都可以正确表达出这个节点的黑白属性。n可以自定义,嵌入式表达和标签的关系也可以自定义,一个节点的初始化嵌入式表达和它的属性与标签有关。
实际训练中图的大小比举例要大很多,训练结束之后即可得到所有关系类型的传播函数,进而可以在更大的图中进行传播标签。
作为一种可选的实施例,根据N个目标数据,生成目标结构图,可以通过以下步骤实现:将N个目标数据确定为N个节点;根据行为信息,确定N个目标数据之间的交互行为为N个节点之间的边,以及确定N个节点之间的边具有的边属性;根据属性信息确定N个节点的节点属性;根据N个节点、N个节点之间的边、N个节点的节点属性和N个节点之间的边具有的边属性,生成目标结构图。
可选地,根据N个目标数据作图时,可以将N个目标数据确定为N个节点,并根据每个目标数据具有的属性信息分别确定N个节点的节点属性。然后可以根据行为信息确定N个目标数据之间的交互行为为N个节点之间的边,有交互行为产生的两个节点之间连接线即为边,一条边表示一次交互行为的发生。然后可以根据交互行为的行为信息确定N个节点之间的边具有的边属性,可以生成目标结构图。
作为一种可选的实施例,确定N个目标数据,可以通过以下步骤实现:获取M个对象数据,其中,M个对象数据包括账户数据和设备数据;根据M个对象数据,确定账户数据各自的账户出入度,其中,账户出入度表征与出入度对应的账户数据的交易频率;将出入度大于预定阈值的账户数据从M个对象数据中删除,将所述M个对象数据中没有被删除的数据确定为确定N个目标数据。
可选地,可以收集M个对象数据,M个对象数据可以进行数据处理得到N个目标数据,有利于后续的作图和模型计算。对M个对象数据进行数据处理的步骤可以为,确定M个对象数据中账户数据各自的账户出入度,账户出入度即为每个账户各自对应的账户出入度的集合,账户出入度中的每个账户出入度分别表征账户数据中每个账户数据的交易频率,也即每个账户转入转出金额的次数之和;去掉出入度大于预定阈值的账户数据,确定M个对象数据中其他没有被删除的数据为N个目标数据,这里提到的出入度为抽象含义的出入度,并不是指具体的某个账户数据的出入度,而是指在账户出入度中大于预定阈值的所有出入度。具体地,可以去掉支付宝和微信的账户数据。同时为了简化图谱,可以将两个账户之间一定时期内的交易聚合,最终只保留借、贷两种交易关系,并且排除聚合后交易金额小于某值的交易边。
图3是根据本发明可选实施例提供的模型更新训练的流程框图,如图3所示,在模型的应用中,如果对数据的风险程度有更新,可以根据更新后的风险信息重新对关系图卷积神经网络进行训练。例如,可以基于后续的客户投诉,或者基于有关机构后续下发的风险信息表,对这些账户和设备的风险信息进行调整。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种风险概率识别装置,需要说明的是,本申请实施例的风险概率识别装置可以用于执行本申请实施例所提供的用于风险概率识别方法。以下对本申请实施例提供的风险概率识别装置进行介绍。
图4是根据本申请实施例的风险概率识别装置的示意图。如图4所示,该装置包括:
确定模块41,用于确定N个目标数据,其中,N个目标数据包括设备数据,N个目标数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的行为信息;
生成模块42,用于根据N个目标数据,生成目标结构图,其中,目标结构图包括N个节点和N个节点之间的边,N个节点分别表征N个目标数据,N个节点各自的节点属性分别由N个目标数据各自的属性信息确定,N个节点之间的边分别表征N个目标数据之间的交互行为,N个节点之间的边的边属性由行为信息确定;
输出模块43,用于将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率。
本申请实施例提供的风险概率识别装置,通过确定N个目标数据,其中,N个目标数据包括设备数据,N个目标数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的行为信息;根据N个目标数据,生成目标结构图,其中,目标结构图包括N个节点和N个节点之间的边,N个节点分别表征N个目标数据,N个节点各自的节点属性分别由N个目标数据各自的属性信息确定,N个节点之间的边分别表征N个目标数据之间的交互行为,N个节点之间的边的边属性由行为信息确定;将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率,解决了相关技术中对金融机构账户进行风险预测时的存在预测结果不准确的问题,进而达到了提升对账户风险预测结果的精确度的技术效果。
所述风险概率识别装置包括处理器和存储器,上述多个模块均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来达到考虑与交易行为相关的设备数据的目的。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述风险概率识别方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行风险概率识别方法。
图5是根据本发明实施例提供的用于进行风险概率的识别电子设备的结构示意图,如图5所示,本发明实施例提供了一种电子设备,电子设备10包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:确定N个目标数据,其中,N个目标数据包括设备数据,N个目标数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的行为信息;根据N个目标数据,生成目标结构图,其中,目标结构图包括N个节点和N个节点之间的边,N个节点分别表征N个目标数据,N个节点各自的节点属性分别由N个目标数据各自的属性信息确定,N个节点之间的边分别表征N个目标数据之间的交互行为,N个节点之间的边的边属性由行为信息确定;将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率。
可选地,将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率,包括:将目标结构图输入图卷积网络单元,由图卷积网络单元输出与N个节点一一对应的N个嵌入式表达,其中,关系图卷积网络模型包括图卷积网络单元,N个嵌入式表达分别表征N个目标节点的特征信息;将N个嵌入式表达输入矩阵运算单元,由矩阵运算单元输出与N个目标数据一一对应的N个风险概率,其中,关系图卷积网络模型包括矩阵运算单元。
可选地,将N个嵌入式表达输入矩阵运算单元,由矩阵运算单元输出与N个目标数据一一对应的N个风险概率,包括:将N个嵌入式表达输入矩阵运算单元,由矩阵运算单元根据N个嵌入式表达分别对应的N个节点对应的对象类型,确定N个嵌入式表达各自对应的矩阵;将N个嵌入式表达与N个嵌入式表达各自对应的矩阵分别相乘,由矩阵运算单元输出与N个目标数据一一对应的N个风险概率。
可选地,将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率,包括:将目标结构图输入图卷积网络单元,由图卷积网络单元输出与N个节点一一对应的N个嵌入式表达,其中,关系图卷积网络模型包括图卷积网络单元,N个嵌入式表达分别表征N个目标节点的特征信息;将N个嵌入式表达输入神经网络模型单元,由神经网络模型单元输出与N个目标数据一一对应的N个风险概率,其中,关系图卷积网络模型包括神经网络模型单元,神经网络模型单元中包括神经网络模型,神经网络模型用于将输入的嵌入式表达转化为风险概率输出。
可选地,关系图卷积网络模型为通过如下方式训练得到的模型,包括:获取L个样本数据和与L个样本数据分别对应的L个风险信息,其中,L个样本数据包括设备数据,L个样本数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的样本行为信息,L个风险信息分别表征L个样本数据的风险状态,L为大于1的整数;根据L个样本数据,生成样本结构图,其中,样本结构图包括L个节点和L个节点之间的边,L个节点分别表征L个样本数据,L个节点各自的节点属性分别由L个样本对象的样本属性信息确定,L个节点之间的边分别表征L个样本数据之间的交互行为,L个节点之间的边的边属性由样本行为信息确定;将样本结构图输入原始神经网络模型,并根据风险信息训练原始神经网络模型,得到关系图卷积网络模型,其中,原始神经网络模型为关系图卷积网络模型的原始模型。
可选地,根据N个目标数据,生成目标结构图,包括:将N个目标数据确定为N个节点;根据行为信息,确定N个目标数据之间的交互行为为N个节点之间的边,以及确定N个节点之间的边具有的边属性;根据属性信息确定N个节点的节点属性;根据N个节点、N个节点之间的边、N个节点的节点属性和N个节点之间的边具有的边属性,生成目标结构图。
可选地,确定N个目标数据,包括:获取M个对象数据,其中,M个对象数据包括账户数据和设备数据;根据M个对象数据,确定账户数据各自的账户出入度,其中,账户出入度分别表征账户数据的交易频率;将出入度大于预定阈值的账户数据从M个对象数据中删除,将M个对象数据中没有被删除的数据确定为N个目标数据。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:确定N个目标数据,其中,N个目标数据包括设备数据,N个目标数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的行为信息;根据N个目标数据,生成目标结构图,其中,目标结构图包括N个节点和N个节点之间的边,N个节点分别表征N个目标数据,N个节点各自的节点属性分别由N个目标数据各自的属性信息确定,N个节点之间的边分别表征N个目标数据之间的交互行为,N个节点之间的边的边属性由行为信息确定;将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率。
可选地,将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率,包括:将目标结构图输入图卷积网络单元,由图卷积网络单元输出与N个节点一一对应的N个嵌入式表达,其中,关系图卷积网络模型包括图卷积网络单元,N个嵌入式表达分别表征N个目标节点的特征信息;将N个嵌入式表达输入矩阵运算单元,由矩阵运算单元输出与N个目标数据一一对应的N个风险概率,其中,关系图卷积网络模型包括矩阵运算单元。
可选地,将N个嵌入式表达输入矩阵运算单元,由矩阵运算单元输出与N个目标数据一一对应的N个风险概率,包括:将N个嵌入式表达输入矩阵运算单元,由矩阵运算单元根据N个嵌入式表达分别对应的N个节点对应的对象类型,确定N个嵌入式表达各自对应的矩阵;将N个嵌入式表达与N个嵌入式表达各自对应的矩阵分别相乘,由矩阵运算单元输出与N个目标数据一一对应的N个风险概率。
可选地,将目标结构图输入预先训练的关系图卷积网络模型,由关系图卷积网络模型输出与N个目标数据一一对应的N个风险概率,包括:将目标结构图输入图卷积网络单元,由图卷积网络单元输出与N个节点一一对应的N个嵌入式表达,其中,关系图卷积网络模型包括图卷积网络单元,N个嵌入式表达分别表征N个目标节点的特征信息;将N个嵌入式表达输入神经网络模型单元,由神经网络模型单元输出与N个目标数据一一对应的N个风险概率,其中,关系图卷积网络模型包括神经网络模型单元,神经网络模型单元中包括神经网络模型,神经网络模型用于将输入的嵌入式表达转化为风险概率输出。
可选地,关系图卷积网络模型为通过如下方式训练得到的模型,包括:获取L个样本数据和与L个样本数据分别对应的L个风险信息,其中,L个样本数据包括设备数据,L个样本数据分别包括数据各自的属性信息以及数据与其它数据之间进行交互的样本行为信息,L个风险信息分别表征L个样本数据的风险状态,L为大于1的整数;根据L个样本数据,生成样本结构图,其中,样本结构图包括L个节点和L个节点之间的边,L个节点分别表征L个样本数据,L个节点各自的节点属性分别由L个样本对象的样本属性信息确定,L个节点之间的边分别表征L个样本数据之间的交互行为,L个节点之间的边的边属性由样本行为信息确定;将样本结构图输入原始神经网络模型,并根据风险信息训练原始神经网络模型,得到关系图卷积网络模型,其中,原始神经网络模型为关系图卷积网络模型的原始模型。
可选地,根据N个目标数据,生成目标结构图,包括:将N个目标数据确定为N个节点;根据行为信息,确定N个目标数据之间的交互行为为N个节点之间的边,以及确定N个节点之间的边具有的边属性;根据属性信息确定N个节点的节点属性;根据N个节点、N个节点之间的边、N个节点的节点属性和N个节点之间的边具有的边属性,生成目标结构图。
可选地,确定N个目标数据,包括:获取M个对象数据,其中,M个对象数据包括账户数据和设备数据;根据M个对象数据,确定账户数据各自的账户出入度,其中,账户出入度分别表征账户数据的交易频率;将出入度大于预定阈值的账户数据从M个对象数据中删除,将M个对象数据中没有被删除的数据确定为N个目标数据。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种风险概率识别方法,其特征在于,包括:
确定N个目标数据,其中,所述N个目标数据包括设备数据,所述N个目标数据分别包括数据各自的属性信息以及所述数据与其它数据之间进行交互的行为信息,N为大于1的整数;
根据所述N个目标数据,生成目标结构图,其中,所述目标结构图包括N个节点和所述N个节点之间的边,所述N个节点分别表征所述N个目标数据,所述N个节点各自的节点属性分别由所述N个目标数据各自的属性信息确定,所述N个节点之间的边分别表征所述N个目标数据之间的交互行为,所述N个节点之间的边的边属性由所述行为信息确定;
将所述目标结构图输入预先训练的关系图卷积网络模型,由所述关系图卷积网络模型输出与所述N个目标数据一一对应的N个风险概率。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标结构图输入预先训练的关系图卷积网络模型,由所述关系图卷积网络模型输出与所述N个目标数据一一对应的N个风险概率,包括:
将所述目标结构图输入图卷积网络单元,由所述图卷积网络单元输出与所述N个节点一一对应的N个嵌入式表达,其中,所述关系图卷积网络模型包括所述图卷积网络单元,所述N个嵌入式表达分别表征所述N个目标节点的特征信息;
将所述N个嵌入式表达输入矩阵运算单元,由所述矩阵运算单元输出与所述N个目标数据一一对应的N个风险概率,其中,所述关系图卷积网络模型包括所述矩阵运算单元。
3.根据权利要求2所述的方法,其特征在于,所述将所述N个嵌入式表达输入矩阵运算单元,由所述矩阵运算单元输出与所述N个目标数据一一对应的N个风险概率,包括:
将所述N个嵌入式表达输入所述矩阵运算单元,由所述矩阵运算单元根据所述N个嵌入式表达分别对应的所述N个节点对应的对象类型,确定所述N个嵌入式表达各自对应的矩阵;
将所述N个嵌入式表达与所述N个嵌入式表达各自对应的矩阵分别相乘,由所述矩阵运算单元输出与所述N个目标数据一一对应的N个风险概率。
4.根据权利要求1所述的方法,其特征在于,所述将所述目标结构图输入预先训练的关系图卷积网络模型,由所述关系图卷积网络模型输出与所述N个目标数据一一对应的N个风险概率,包括:
将所述目标结构图输入图卷积网络单元,由所述图卷积网络单元输出与所述N个节点一一对应的N个嵌入式表达,其中,所述关系图卷积网络模型包括所述图卷积网络单元,所述N个嵌入式表达分别表征所述N个目标节点的特征信息;
将所述N个嵌入式表达输入神经网络模型单元,由所述神经网络模型单元输出与所述N个目标数据一一对应的N个风险概率,其中,所述关系图卷积网络模型包括所述神经网络模型单元,所述神经网络模型单元中包括神经网络模型,所述神经网络模型用于将输入的嵌入式表达转化为风险概率输出。
5.根据权利要求1所述的方法,其特征在于,所述关系图卷积网络模型为通过如下方式训练得到的模型:
获取L个样本数据和与所述L个样本数据分别对应的L个风险信息,其中,所述L个样本数据包括设备数据,所述L个样本数据分别包括数据各自的属性信息以及所述数据与其它数据之间进行交互的样本行为信息,所述L个风险信息分别表征所述L个样本数据的风险状态,L为大于1的整数;
根据所述L个样本数据,生成样本结构图,其中,所述样本结构图包括L个节点和所述L个节点之间的边,所述L个节点分别表征所述L个样本数据,所述L个节点各自的节点属性分别由所述L个样本对象的样本属性信息确定,所述L个节点之间的边分别表征所述L个样本数据之间的交互行为,所述L个节点之间的边的边属性由所述样本行为信息确定;
将所述样本结构图输入原始神经网络模型,并根据所述L个风险信息训练所述原始神经网络模型,得到所述关系图卷积网络模型,其中,所述原始神经网络模型为所述关系图卷积网络模型的原始模型。
6.根据权利要求1所述的方法,其特征在于,所述根据所述N个目标数据,生成目标结构图,包括:
将所述N个目标数据确定为所述N个节点;
根据所述行为信息,确定所述N个目标数据之间的交互行为为所述N个节点之间的边,以及确定所述N个节点之间的边具有的边属性;
根据所述属性信息确定所述N个节点的节点属性;
根据所述N个节点、所述N个节点之间的边、所述N个节点的节点属性和所述N个节点之间的边具有的边属性,生成所述目标结构图。
7.根据权利要求1所述的方法,其特征在于,所述确定N个目标数据,包括:
获取M个对象数据,其中,所述M个对象数据包括账户数据和所述设备数据,M为大于1的整数;
根据所述M个对象数据,确定所述账户数据各自的账户出入度,其中,所述账户出入度分别表征所述账户数据的交易频率;
将出入度大于预定阈值的账户数据从所述M个对象数据中删除,将所述M个对象数据中没有被删除的数据确定为所述N个目标数据。
8.一种风险概率识别方法装置,其特征在于,包括:
确定模块,用于确定N个目标数据,其中,所述N个目标数据包括设备数据,所述N个目标数据分别包括数据各自的属性信息以及所述数据与其它数据之间进行交互的行为信息;
生成模块,用于根据所述N个目标数据,生成目标结构图,其中,所述目标结构图包括N个节点和所述N个节点之间的边,所述N个节点分别表征所述N个目标数据,所述N个节点各自的节点属性分别由所述N个目标数据各自的属性信息确定,所述N个节点之间的边分别表征所述N个目标数据之间的交互行为,所述N个节点之间的边的边属性由所述行为信息确定;
输出模块,用于将所述目标结构图输入预先训练的关系图卷积网络模型,由所述关系图卷积网络模型输出与所述N个目标数据一一对应的N个风险概率。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述风险概率识别方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述风险概率识别方法。
CN202211476079.6A 2022-11-23 2022-11-23 风险概率识别方法、装置、处理器和电子设备 Pending CN115730823A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211476079.6A CN115730823A (zh) 2022-11-23 2022-11-23 风险概率识别方法、装置、处理器和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211476079.6A CN115730823A (zh) 2022-11-23 2022-11-23 风险概率识别方法、装置、处理器和电子设备

Publications (1)

Publication Number Publication Date
CN115730823A true CN115730823A (zh) 2023-03-03

Family

ID=85297709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211476079.6A Pending CN115730823A (zh) 2022-11-23 2022-11-23 风险概率识别方法、装置、处理器和电子设备

Country Status (1)

Country Link
CN (1) CN115730823A (zh)

Similar Documents

Publication Publication Date Title
CN110363449B (zh) 一种风险识别方法、装置及系统
US11621930B2 (en) Systems and methods for generating dynamic conversational responses using trained machine learning models
CN112463968B (zh) 文本分类方法、装置和电子设备
CN110674188A (zh) 一种特征提取方法、装置及设备
CN112214652B (zh) 一种报文生成方法、装置及设备
CN111898675B (zh) 信贷风控模型生成方法、装置、评分卡生成方法、机器可读介质及设备
Haridasan et al. Arithmetic Optimization with Deep Learning Enabled Churn Prediction Model for Telecommunication Industries.
CN116542673B (zh) 应用于机器学习的欺诈行为识别方法及系统
CN111259975B (zh) 分类器的生成方法及装置、文本的分类方法及装置
CN113159213A (zh) 一种业务分配方法、装置及设备
CN112598526A (zh) 资产数据的处理方法及装置
WO2023185125A1 (zh) 产品资源的数据处理方法及装置、电子设备、存储介质
CN116720214A (zh) 一种用于隐私保护的模型训练方法及装置
CN109697224B (zh) 一种账单消息处理方法、装置和存储介质
CN115994331A (zh) 基于决策树的报文分拣方法及装置
CN115600818A (zh) 多维评分方法、装置、电子设备和存储介质
CN115730823A (zh) 风险概率识别方法、装置、处理器和电子设备
US11694038B2 (en) Systems and methods for generating dynamic conversational responses through aggregated outputs of machine learning models
US20240062051A1 (en) Hierarchical data labeling for machine learning using semi-supervised multi-level labeling framework
US12008329B2 (en) Systems and methods for generating dynamic conversational responses through aggregated outputs of machine learning models
CN115545938B (zh) 一种执行风险识别业务的方法、装置、存储介质及设备
US20230419098A1 (en) Utilizing selective transformation and replacement with high-dimensionality projection layers to implement neural networks in tabular data environments
US20240152933A1 (en) Automatic mapping of a question or compliance controls associated with a compliance standard to compliance controls associated with another compliance standard
CN115860937A (zh) 差错处理方法、装置、非易失性存储介质及电子设备
CN117351297A (zh) 噪声干扰图像的识别方法、装置、处理器及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination