CN116596653A - 一种信用风险识别方法、装置、设备及存储介质 - Google Patents
一种信用风险识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116596653A CN116596653A CN202310400724.4A CN202310400724A CN116596653A CN 116596653 A CN116596653 A CN 116596653A CN 202310400724 A CN202310400724 A CN 202310400724A CN 116596653 A CN116596653 A CN 116596653A
- Authority
- CN
- China
- Prior art keywords
- transaction
- data
- account
- target
- target account
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请公开了一种信用风险识别方法、装置、设备及存储介质,引入了账户的转账、交易等关系数据,弥补了传统机器学习账户关系特征缺失的不足,同时基于构建的关系数据对账户的交易特征数据进行预处理和聚合,提升信用风险识别的效果,在存在风险用户的数据集中,信用风险识别的效果提升更为明显。解决了传统的机器学习模型,主要用到的是静态的、经过聚合的客户基础特征或客户行为特征。不能够从时间流转维度或客户关系维度综合对客户进行描述,存在的由于机器学习账户关系特征缺失导致的信用风险识别效果不佳的技术问题。
Description
技术领域
本申请涉及金融科技技术领域,尤其涉及一种信用风险识别方法、装置、设备及存储介质。
背景技术
信用风险识别在银行业至关重要。银行都很愿意向借款人提供更多的借款额度,在帮助借款人解决用款的眉头之急之时,也收取相应利息从而盈利。此时,银行可能会产生两种问题:1)将借款人的风险定级过高,导致没有给到足够的借款额度从而降低盈利水平;2)将借款人的风险定级过低,导致提供的借款额度过高,而致借款人无法按时还款造成损失。这两种问题都是银行不愿意看到的。在追求收益最大化的同时,又要降低风险是保证银行持续盈利的基础能力。并且,借款人的状态是实时变化的,风险水平也不断变化,如果能从借款人与银行的触点数据中尽早准确识别借款人的风险变化,会大大提高盈利和降低逾期或坏账的损失。
近年,大数据技术在信用风险领域有很广泛的应用。在实际上线的风险识别应用中,依然是以策略规则或传统机器学习为主,如梯度提升决策树模型。
这些传统的机器学习模型,主要用到的是静态的、经过聚合的客户基础特征或客户行为特征。不能够从时间流转维度或客户关系维度综合对客户进行描述,由于机器学习账户关系特征缺失导致了信用风险识别效果不佳的技术问题。
发明内容
本申请提供了一种信用风险识别方法、装置、设备及存储介质,解决了传统的机器学习模型,主要用到的是静态的、经过聚合的客户基础特征或客户行为特征。不能够从时间流转维度或客户关系维度综合对客户进行描述,存在的由于机器学习账户关系特征缺失导致的信用风险识别效果不佳的技术问题。
有鉴于此,本申请第一方面提供了一种信用风险识别方法,所述方法包括:
S1、获取目标账户的转账关系数据,并构建所述目标账户与其他账户的转账关系边,构造转账点边关系数据;
S2、获取所述目标账户的交易数据,并构建所述目标账户与商户账户的交易关系边,构造交易点边关系数据;
S3、获取所述目标账户的交易特征数据,并对所述交易特征数据进行预处理;
S4、根据所述转账边关系数据以及所述交易点边关系数据对所述交易特征数据进行特征聚合,得到所述目标账户的聚合交易特征数据;
S5、将所述聚合交易特征数据作为目标深度神经网络的输入数据,得到以信用风险识别概率为输出数据的目标深度神经网络;
S6、基于所述目标深度神经网络进行账户风险识别。
可选地,所述步骤S1具体包括:
S11、获取第一目标时间段内目标账户与其他账户之间的转账关系数据;
S12、以所述目标账户为点,按转出账户到转入账户构建所述目标账户与其他账户的转账关系边,生成转账点边关系数据。
可选地,所述步骤S2具体包括:
S21、获取第二目标时间段内所述目标账户与商户账户之间的交易数据;
S22、以所述目标账户为点,按预设时间段内在同一商户有交易数据的商户账户构建所述目标账户与商户账户的无向的交易关系边,生成交易点边关系数据。
可选地,所述步骤S21之后、所述步骤S22之前还包括:
统计所述目标账户与同一商户账户之间的交易数据量;
根据所述交易数据量确定构建所述标账户与商户账户的交易关系边的预设时间段。
可选地,所述步骤S3具体包括:
获取所述目标账户的交易特征数据;
若所述交易特征数据为连续型特征数据,则对所述交易特征数据进行正态化、归一化处理;
若所述交易特征数据为离散型特征数据,则按预设坏率转化公式转换为连续型特征数据,所述预设坏率转化公式具体为:
其中:为所述离散型特征数据第i类特征值的坏样本个数,/>为所述离散型特征数据第i类特征值的样本总个数。
可选地,所述步骤S4具体包括:
根据所述转账边关系数据以及所述交易点边关系数据对邻居进行随机抽样,每一跳抽样预设数量的邻居对应的交易特征数据;
通过预设聚合公式对所述交易特征数据进行特征聚合,所述预设聚合公式具体为:
其中:v为待计算节点,u为v的邻居节点,为节点v在第l层聚合时的特征;AGG表示聚合方式,σ为sigmoid函数,W(l)为权重。
可选地,所述步骤S5还包括:
所述目标深度神经网络接入sigma或softmax。
本申请第二方面提供一种信用风险识别装置,所述装置包括:
第一构建单元,用于获取目标账户的转账关系数据,并构建所述目标账户与其他账户的转账关系边,构造转账点边关系数据;
第二构建单元,用于获取所述目标账户的交易数据,并构建所述目标账户与商户账户的交易关系边,构造交易点边关系数据;
第三构建单元,用于获取所述目标账户的交易特征数据,并对所述交易特征数据进行预处理;
特征聚合单元,用于根据所述转账边关系数据以及所述交易点边关系数据对所述交易特征数据进行特征聚合,得到所述目标账户的聚合交易特征数据;
训练单元,用于将所述聚合交易特征数据作为目标深度神经网络的输入数据,得到以信用风险识别概率为输出数据的目标深度神经网络;
风险识别单元,用于基于所述目标深度神经网络进行账户风险识别。
可选地,所述第一构建单元具体用于:
获取第一目标时间段内目标账户与其他账户之间的转账关系数据;
以所述目标账户为点,按转出账户到转入账户构建所述目标账户与其他账户的转账关系边,生成转账点边关系数据。
可选地,所述第二构建单元具体用于:
获取第二目标时间段内所述目标账户与商户账户之间的交易数据;
以所述目标账户为点,按预设时间段内在同一商户有交易数据的商户账户构建所述目标账户与商户账户的无向的交易关系边,生成交易点边关系数据。
可选地,所述第二构建单元还用于:
统计所述目标账户与同一商户账户之间的交易数据量;
根据所述交易数据量确定构建所述标账户与商户账户的交易关系边的预设时间段。
可选地,所述第三构建单元具体用于:
获取所述目标账户的交易特征数据;
若所述交易特征数据为连续型特征数据,则对所述交易特征数据进行正态化、归一化处理;
若所述交易特征数据为离散型特征数据,则按预设坏率转化公式转换为连续型特征数据,所述预设坏率转化公式具体为:
其中:为所述离散型特征数据第i类特征值的坏样本个数,/>为所述离散型特征数据第i类特征值的样本总个数。
可选地,所述特征聚合单元具体用于:
根据所述转账边关系数据以及所述交易点边关系数据对邻居进行随机抽样,每一跳抽样预设数量的邻居对应的交易特征数据;
通过预设聚合公式对所述交易特征数据进行特征聚合,所述预设聚合公式具体为:
其中:v为待计算节点,u为v的邻居节点,为节点v在第l层聚合时的特征;AGG表示聚合方式,σ为sigmoid函数,W(l)为权重。
本申请第三方面提供一种信用风险识别设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的信用风险识别方法的步骤。
本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的信用风险识别方法的步骤。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中,提供了一种信用风险识别方法、装置、设备及存储介质,引入了账户的转账、交易等关系数据,弥补了传统机器学习账户关系特征缺失的不足,同时基于构建的关系数据对账户的交易特征数据进行预处理和聚合,提升信用风险识别的效果,在存在风险用户的数据集中,信用风险识别的效果提升更为明显。解决了传统的机器学习模型,主要用到的是静态的、经过聚合的客户基础特征或客户行为特征。不能够从时间流转维度或客户关系维度综合对客户进行描述,存在的由于机器学习账户关系特征缺失导致的信用风险识别效果不佳的技术问题。
附图说明
图1为本申请实施例中信用风险识别方法的方法流程图;
图2为本申请实施例中信用风险识别方法的应用框架流程图;
图3为本申请实施例中信用风险识别装置的结构示意图;
图4为本申请实施例中信用风险识别设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请设计了一种信用风险识别方法、装置、设备及存储介质,解决了传统的机器学习模型,主要用到的是静态的、经过聚合的客户基础特征或客户行为特征。不能够从时间流转维度或客户关系维度综合对客户进行描述,存在的由于机器学习账户关系特征缺失导致的信用风险识别效果不佳的技术问题。
为了便于理解,请参阅图1和图2,图1为本申请实施例中信用风险识别方法的方法流程图,图2为本申请实施例中信用风险识别方法的应用框架流程图,如图1和图2所示,具体为:
S1、获取目标账户的转账关系数据,并构建目标账户与其他账户的转账关系边,构造转账点边关系数据;
步骤S1具体包括:
S11、获取第一目标时间段内目标账户与其他账户之间的转账关系数据;
S12、以目标账户为点,按转出账户到转入账户构建目标账户与其他账户的转账关系边,生成转账点边关系数据。
需要说明的是,获取某一时段目标账户与其他账户之间转账关系数据,以目标账户为点,按转出账户到转入账户构建转账关系边,构造转账点边关系数据。如图2,在某一时段账户1向账户2有转账记录,账户1——>账户2构成一条有向转账关系。
S2、获取目标账户的交易数据,并构建目标账户与商户账户的交易关系边,构造交易点边关系数据;
步骤S2具体包括:
S21、获取第二目标时间段内目标账户与商户账户之间的交易数据;
S22、统计目标账户与同一商户账户之间的交易数据量;
S23、根据交易数据量确定构建标账户与商户账户的交易关系边的预设时间段;
S24、以目标账户为点,按预设时间段内在同一商户有交易数据的商户账户构建目标账户与商户账户的无向的交易关系边,生成交易点边关系数据。
需要说明的是,获取某一时段目标账户与商户账户之间的交易数据,以目标账户为点,按固定时间段内在同一商户有过购买记录的账户构成一条边,构造交易点边关系数据。如图2,在某一时段账户1、账户2、账户4均在商户1有过购买记录,账户1——账户2、账户1——账户4、账户2——账户4,构成3条无向交易边。
在构造交易关系边时,会存在超级商户,任意导致数据爆炸现象。
可以采用分级处理账户数据,对于交易量少的账户,构造点边关系的时间段可以设置长一些,对于交易量大的账户,构造点边关系的时间段可以设置段一些。
比如:整个交易数据的时间段为半年,对于半年中交易量小于3次的账户,可以将构造点边关系的时间段设置为半年;对于半年中交易量小于10次大于3次的账户,可以将构造点边关系的时间段设置为月;对于半年中交易量大于10次小于100次的账户,可以将构造点边关系的时间段设置为7天;对于半年中交易量大于100次的账户,可以将构造点边关系的时间段设置为天。
根据数据的实际情况调整相应阈值。
还可以去掉超级商户、去掉交易金额很低的交易记录等设置,来构造合适的交易点边关系数据。
S3、获取目标账户的交易特征数据,并对交易特征数据进行预处理;
步骤S3具体包括:
获取目标账户的交易特征数据;
若交易特征数据为连续型特征数据,则对交易特征数据进行正态化、归一化处理;
若交易特征数据为离散型特征数据,则按预设坏率转化公式转换为连续型特征数据,预设坏率转化公式具体为:
其中:为离散型特征数据第i类特征值的坏样本个数,/>为离散型特征数据第i类特征值的样本总个数。
需要说明的是,为了避免造成歧视或使用客户隐私信息,目标账户的交易特征数据不使用持有人性别、年龄等人口特征,仅使用客户触点行为特征数据、信用特征数据等,如:消费、还款、欠款、逾期等相关特征数据。
若交易特征数据为连续型特征数据,则对交易特征数据进行正态化、归一化处理;
若交易特征数据为离散型特征数据,则按预设坏率转化公式转换为连续型特征数据,预设坏率转化公式具体为:
其中:为离散型特征数据第i类特征值的坏样本个数,/>为离散型特征数据第i类特征值的样本总个数。
S4、根据转账边关系数据以及交易点边关系数据对交易特征数据进行特征聚合,得到目标账户的聚合交易特征数据;
步骤S4具体包括:
根据转账边关系数据以及交易点边关系数据对邻居进行随机抽样,每一跳抽样预设数量的邻居对应的交易特征数据;
通过预设聚合公式对交易特征数据进行特征聚合,预设聚合公式具体为:
其中:v为待计算节点,u为v的邻居节点,为节点v在第l层聚合时的特征;AGG表示聚合方式,σ为sigmoid函数,W(l)为权重。
需要说明的是,按照步骤S1至S4构造的转账点边关系数据、交易点边关系数据,以及预处理后的交易特征数据,由于关系数据量大,对开发环境基础资源、模型训练时长都是很大的压力。
在特征聚合时,选用抽样方式,根据转账边关系数据以及交易点边关系数据对邻居进行随机抽样,每一跳抽样预设数量的邻居对应的交易特征数据,其中,与节点直接相连的称为1跳,有两步间接相连的为2跳。如图2所示,在账户转账关系图中,账户1与账户2是1跳关系,账户1与账户3是2跳关系。
通过预设聚合公式对交易特征数据进行特征聚合,预设聚合公式具体为:
其中:v为待计算节点,u为v的邻居节点,为节点v在第l层聚合时的特征;AGG表示聚合方式,可以取平均值、最大值、池化、LSTM等方式,σ为sigmoid函数,W(l)为权重。
S5、将聚合交易特征数据作为目标深度神经网络的输入数据,得到以信用风险识别概率为输出数据的目标深度神经网络;
步骤S5还包括:
目标深度神经网络接入sigma或softmax。
需要说明的是,采用深度神经网络DNN作为目标深度神经网络,将聚合交易特征数据作为输入,信用风险识别概率作为输出。
目标深度神经网络接入sigma或softmax,输出信用风险识别概率。
另外,由图神经网络训练过程中产生的账户级嵌入特征,可视为从图关系中提取的特征,表示账户在图关系上的属性的表征,可以与其他表格特征一起,输入到其他模型(如梯度提升决策树模型、时间序列深度学习模型),以提升其他模型效果。
S6、基于目标深度神经网络进行账户风险识别。
请参阅图3,图3为本申请实施例中信用风险识别装置的结构示意图,如图3所示,具体为:
第一构建单元301,用于获取目标账户的转账关系数据,并构建目标账户与其他账户的转账关系边,构造转账点边关系数据;
第二构建单元302,用于获取目标账户的交易数据,并构建目标账户与商户账户的交易关系边,构造交易点边关系数据;
第三构建单元303,用于获取目标账户的交易特征数据,并对交易特征数据进行预处理;
特征聚合单元304,用于根据转账边关系数据以及交易点边关系数据对交易特征数据进行特征聚合,得到目标账户的聚合交易特征数据;
训练单元305,用于将聚合交易特征数据作为目标深度神经网络的输入数据,得到以信用风险识别概率为输出数据的目标深度神经网络;
风险识别单元306,用于基于目标深度神经网络进行账户风险识别。
进一步地,第一构建单元301具体用于:
获取第一目标时间段内目标账户与其他账户之间的转账关系数据;
以目标账户为点,按转出账户到转入账户构建目标账户与其他账户的转账关系边,生成转账点边关系数据。
进一步地,第二构建单元302具体用于:
获取第二目标时间段内目标账户与商户账户之间的交易数据;
以目标账户为点,按预设时间段内在同一商户有交易数据的商户账户构建目标账户与商户账户的无向的交易关系边,生成交易点边关系数据。
进一步地,第二构建单元302还用于:
统计目标账户与同一商户账户之间的交易数据量;
根据交易数据量确定构建标账户与商户账户的交易关系边的预设时间段。
进一步地,第三构建单元303具体用于:
获取目标账户的交易特征数据;
若交易特征数据为连续型特征数据,则对交易特征数据进行正态化、归一化处理;
若交易特征数据为离散型特征数据,则按预设坏率转化公式转换为连续型特征数据,预设坏率转化公式具体为:
其中:为离散型特征数据第i类特征值的坏样本个数,/>为离散型特征数据第i类特征值的样本总个数。
进一步地,特征聚合单元304具体用于:
根据转账边关系数据以及交易点边关系数据对邻居进行随机抽样,每一跳抽样预设数量的邻居对应的交易特征数据;
通过预设聚合公式对交易特征数据进行特征聚合,预设聚合公式具体为:
其中:v为待计算节点,u为v的邻居节点,为节点v在第l层聚合时的特征;AGG表示聚合方式,σ为sigmoid函数,W(l)为权重。
本申请实施例还提供了另一种信用风险识别设备,如图4所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(英文全称:PersonalDigitalAssistant,英文缩写:PDA)、销售终端(英文全称:Point ofSales,英文缩写:POS)、车载电脑等任意终端设备,以终端为手机为例:
图4示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图4,手机包括:射频(英文全称:Radio Frequency,英文缩写:RF)电路1010、存储器1020、输入单元1030、显示单元1040、传感器1050、音频电路1060、无线保真(英文全称:wirelessfidelity,英文缩写:WiFi)模块1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解,图4中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图4对手机的各个构成部件进行具体的介绍:
RF电路1010可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1080处理;另外,将设计上行的数据发送给基站。通常,RF电路1010包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(英文全称:LowNoiseAmplifier,英文缩写:LNA)、双工器等。此外,RF电路1010还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(英文全称:Global System ofMobile communication,英文缩写:GSM)、通用分组无线服务(英文全称:GeneralPacket Radio Service,GPRS)、码分多址(英文全称:CodeDivision Multiple Access,英文缩写:CDMA)、宽带码分多址(英文全称:Wideband CodeDivisionMultipleAccess,英文缩写:WCDMA)、长期演进(英文全称:Long TermEvolution,英文缩写:LTE)、电子邮件、短消息服务(英文全称:ShortMessaging Service,SMS)等。
存储器1020可用于存储软件程序以及模块,处理器1080通过运行存储在存储器1020的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1020可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1030可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1030可包括触控面板1031以及其他输入设备1032。触控面板1031,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1031上或在触控面板1031附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1031可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1080,并能接收处理器1080发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1031。除了触控面板1031,输入单元1030还可以包括其他输入设备1032。具体地,其他输入设备1032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1040可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1040可包括显示面板1041,可选的,可以采用液晶显示器(英文全称:Liquid Crystal Display,英文缩写:LCD)、有机发光二极管(英文全称:Organic Light-Emitting Diode,英文缩写:OLED)等形式来配置显示面板1041。进一步的,触控面板1031可覆盖显示面板1041,当触控面板1031检测到在其上或附近的触摸操作后,传送给处理器1080以确定触摸事件的类型,随后处理器1080根据触摸事件的类型在显示面板1041上提供相应的视觉输出。虽然在图4中,触控面板1031与显示面板1041是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1031与显示面板1041集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器1050,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1041的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1041和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1060、扬声器1061,传声器1062可提供用户与手机之间的音频接口。音频电路1060可将接收到的音频数据转换后的电信号,传输到扬声器1061,由扬声器1061转换为声音信号输出;另一方面,传声器1062将收集的声音信号转换为电信号,由音频电路1060接收后转换为音频数据,再将音频数据输出处理器1080处理后,经RF电路1010以发送给比如另一手机,或者将音频数据输出至存储器1020以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块1070可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图4示出了WiFi模块1070,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1080是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1020内的软件程序和/或模块,以及调用存储在存储器1020内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器1080可包括一个或多个处理单元;优选的,处理器1080可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1080中。
手机还包括给各个部件供电的电源1090(比如电池),优选的,电源可以通过电源管理系统与处理器1080逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该终端所包括的处理器1080还具有以下功能:
S1、获取目标账户的转账关系数据,并构建目标账户与其他账户的转账关系边,构造转账点边关系数据;
S2、获取目标账户的交易数据,并构建目标账户与商户账户的交易关系边,构造交易点边关系数据;
S3、获取目标账户的交易特征数据,并对交易特征数据进行预处理;
S4、根据转账边关系数据以及交易点边关系数据对交易特征数据进行特征聚合,得到目标账户的聚合交易特征数据;
S5、将聚合交易特征数据作为目标深度神经网络的输入数据,得到以信用风险识别概率为输出数据的目标深度神经网络;
S6、基于目标深度神经网络进行账户风险识别。
本申请实施例还提供一种计算机可读存储介质,用于存储程序代码,该程序代码用于执行前述各个实施例所述的一种信用风险识别方法中的任意一种实施方式。
本申请实施例中,提供了一种信用风险识别方法、装置、设备及存储介质,引入了账户的转账、交易等关系数据,弥补了传统机器学习账户关系特征缺失的不足,同时基于构建的关系数据对账户的交易特征数据进行预处理和聚合,提升信用风险识别的效果,在存在风险用户的数据集中,信用风险识别的效果提升更为明显。解决了传统的机器学习模型,主要用到的是静态的、经过聚合的客户基础特征或客户行为特征。不能够从时间流转维度或客户关系维度综合对客户进行描述,存在的由于机器学习账户关系特征缺失导致的信用风险识别效果不佳的技术问题。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:RandomAccess Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (15)
1.一种信用风险识别方法,其特征在于,包括:
S1、获取目标账户的转账关系数据,并构建所述目标账户与其他账户的转账关系边,构造转账点边关系数据;
S2、获取所述目标账户的交易数据,并构建所述目标账户与商户账户的交易关系边,构造交易点边关系数据;
S3、获取所述目标账户的交易特征数据,并对所述交易特征数据进行预处理;
S4、根据所述转账边关系数据以及所述交易点边关系数据对所述交易特征数据进行特征聚合,得到所述目标账户的聚合交易特征数据;
S5、将所述聚合交易特征数据作为目标深度神经网络的输入数据,得到以信用风险识别概率为输出数据的目标深度神经网络;
S6、基于所述目标深度神经网络进行账户风险识别。
2.根据权利要求1所述的信用风险识别方法,其特征在于,所述步骤S1具体包括:
S11、获取第一目标时间段内目标账户与其他账户之间的转账关系数据;
S12、以所述目标账户为点,按转出账户到转入账户构建所述目标账户与其他账户的转账关系边,生成转账点边关系数据。
3.根据权利要求1所述的信用风险识别方法,其特征在于,所述步骤S2具体包括:
S21、获取第二目标时间段内所述目标账户与商户账户之间的交易数据;
S22、以所述目标账户为点,按预设时间段内在同一商户有交易数据的商户账户构建所述目标账户与商户账户的无向的交易关系边,生成交易点边关系数据。
4.根据权利要求3所述的信用风险识别方法,其特征在于,所述步骤S21之后、所述步骤S22之前还包括:
统计所述目标账户与同一商户账户之间的交易数据量;
根据所述交易数据量确定构建所述标账户与商户账户的交易关系边的预设时间段。
5.根据权利要求1所述的信用风险识别方法,其特征在于,所述步骤S3具体包括:
获取所述目标账户的交易特征数据;
若所述交易特征数据为连续型特征数据,则对所述交易特征数据进行正态化、归一化处理;
若所述交易特征数据为离散型特征数据,则按预设坏率转化公式转换为连续型特征数据,所述预设坏率转化公式具体为:
其中:为所述离散型特征数据第i类特征值的坏样本个数,/>为所述离散型特征数据第i类特征值的样本总个数。
6.根据权利要求1所述的信用风险识别方法,其特征在于,所述步骤S4具体包括:
根据所述转账边关系数据以及所述交易点边关系数据对邻居进行随机抽样,每一跳抽样预设数量的邻居对应的交易特征数据;
通过预设聚合公式对所述交易特征数据进行特征聚合,所述预设聚合公式具体为:
其中:v为待计算节点,u为v的邻居节点,为节点v在第l层聚合时的特征;AGG表示聚合方式,σ为sigmoid函数,W(l)为权重。
7.根据权利要求1所述的信用风险识别方法,其特征在于,所述步骤S5还包括:
所述目标深度神经网络接入sigma或softmax。
8.一种信用风险识别装置,其特征在于,包括:
第一构建单元,用于获取目标账户的转账关系数据,并构建所述目标账户与其他账户的转账关系边,构造转账点边关系数据;
第二构建单元,用于获取所述目标账户的交易数据,并构建所述目标账户与商户账户的交易关系边,构造交易点边关系数据;
第三构建单元,用于获取所述目标账户的交易特征数据,并对所述交易特征数据进行预处理;
特征聚合单元,用于根据所述转账边关系数据以及所述交易点边关系数据对所述交易特征数据进行特征聚合,得到所述目标账户的聚合交易特征数据;
训练单元,用于将所述聚合交易特征数据作为目标深度神经网络的输入数据,得到以信用风险识别概率为输出数据的目标深度神经网络;
风险识别单元,用于基于所述目标深度神经网络进行账户风险识别。
9.根据权利要求8所述的信用风险识别装置,其特征在于,所述第一构建单元具体用于:
获取第一目标时间段内目标账户与其他账户之间的转账关系数据;
以所述目标账户为点,按转出账户到转入账户构建所述目标账户与其他账户的转账关系边,生成转账点边关系数据。
10.根据权利要求8所述的信用风险识别装置,其特征在于,所述第二构建单元具体用于:
获取第二目标时间段内所述目标账户与商户账户之间的交易数据;
以所述目标账户为点,按预设时间段内在同一商户有交易数据的商户账户构建所述目标账户与商户账户的无向的交易关系边,生成交易点边关系数据。
11.根据权利要求10所述的信用风险识别装置,其特征在于,所述第二构建单元还用于:
统计所述目标账户与同一商户账户之间的交易数据量;
根据所述交易数据量确定构建所述标账户与商户账户的交易关系边的预设时间段。
12.根据权利要求8所述的信用风险识别装置,其特征在于,所述第三构建单元具体用于:
获取所述目标账户的交易特征数据;
若所述交易特征数据为连续型特征数据,则对所述交易特征数据进行正态化、归一化处理;
若所述交易特征数据为离散型特征数据,则按预设坏率转化公式转换为连续型特征数据,所述预设坏率转化公式具体为:
其中:为所述离散型特征数据第i类特征值的坏样本个数,/>为所述离散型特征数据第i类特征值的样本总个数。
13.根据权利要求8所述的信用风险识别装置,其特征在于,所述特征聚合单元具体用于:
根据所述转账边关系数据以及所述交易点边关系数据对邻居进行随机抽样,每一跳抽样预设数量的邻居对应的交易特征数据;
通过预设聚合公式对所述交易特征数据进行特征聚合,所述预设聚合公式具体为:
其中:v为待计算节点,u为v的邻居节点,为节点v在第l层聚合时的特征;AGG表示聚合方式,σ为sigmoid函数,W(l)为权重。
14.一种信用风险识别设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-7任一项所述的信用风险识别方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-7任一项所述的信用风险识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310400724.4A CN116596653A (zh) | 2023-04-14 | 2023-04-14 | 一种信用风险识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310400724.4A CN116596653A (zh) | 2023-04-14 | 2023-04-14 | 一种信用风险识别方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116596653A true CN116596653A (zh) | 2023-08-15 |
Family
ID=87592677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310400724.4A Pending CN116596653A (zh) | 2023-04-14 | 2023-04-14 | 一种信用风险识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116596653A (zh) |
-
2023
- 2023-04-14 CN CN202310400724.4A patent/CN116596653A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107230133B (zh) | 一种数据处理方法、设备和计算机存储介质 | |
CN111125523B (zh) | 搜索方法、装置、终端设备及存储介质 | |
CN115392405A (zh) | 模型训练方法、相关装置及存储介质 | |
CN111027854A (zh) | 一种基于企业大数据的综合画像指数生成方法及相关设备 | |
CN111951021B (zh) | 一种可疑社团的发现方法和装置、存储介质及计算机设备 | |
CN109993337A (zh) | 一种金融产品实时管理方法、装置和服务器 | |
CN115412726B (zh) | 视频真伪检测方法、装置及存储介质 | |
CN113648659B (zh) | 一种确定用户活跃度的方法和相关装置 | |
CN116167867A (zh) | 基于知识图谱的保险业务风险识别方法、装置及电子设备 | |
CN116992162A (zh) | 一种对象的推荐方法、装置以及存储介质 | |
CN116596653A (zh) | 一种信用风险识别方法、装置、设备及存储介质 | |
CN115330522A (zh) | 基于聚类的信用卡审批方法、装置、电子设备和介质 | |
CN115082071A (zh) | 一种异常交易账户的识别方法、装置及存储介质 | |
CN114971635A (zh) | 一种交易风险的管理方法以及相关装置 | |
CN112016345A (zh) | 一种图像识别方法和装置 | |
CN112837061B (zh) | 一种数据处理方法和相关装置 | |
CN116777219A (zh) | 一种目标企业风险评估方法、装置、设备及存储介质 | |
CN118691399A (zh) | 一种大数据虚拟资源处理方法、装置、设备及存储介质 | |
CN112163164B (zh) | 一种用户标签确定方法和相关装置 | |
CN118860815A (zh) | 一种参数分析方法和相关装置 | |
CN116188014A (zh) | 风险票据团伙识别方法、装置、介质及设备 | |
CN115809905A (zh) | 一种对象可信度评估方法、装置及相关产品 | |
CN116703808A (zh) | 假商品样本图像生成方法、相关装置及存储介质 | |
CN116257564A (zh) | 一种资产组合规模预测方法、装置、设备及存储介质 | |
CN117011023A (zh) | 一种全链路回归数据管理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |