CN115545886A - 逾期风险识别方法、装置、设备及存储介质 - Google Patents

逾期风险识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115545886A
CN115545886A CN202211167464.2A CN202211167464A CN115545886A CN 115545886 A CN115545886 A CN 115545886A CN 202211167464 A CN202211167464 A CN 202211167464A CN 115545886 A CN115545886 A CN 115545886A
Authority
CN
China
Prior art keywords
overdue
target
prediction
client
overdue risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211167464.2A
Other languages
English (en)
Inventor
叶芸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Boc Financial Technology Suzhou Co ltd
Original Assignee
Boc Financial Technology Suzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Boc Financial Technology Suzhou Co ltd filed Critical Boc Financial Technology Suzhou Co ltd
Priority to CN202211167464.2A priority Critical patent/CN115545886A/zh
Publication of CN115545886A publication Critical patent/CN115545886A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本申请提供一种逾期风险识别方法、装置、设备及存储介质,包括基于待识别客户的特征数据构建出待识别客户的多维度特征标签;将多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类目标逾期风险预测模型输出的逾期预测概率;确定逾期预测概率中概率值最大的目标逾期预测概率,并将目标逾期预测概率及目标逾期预测概率对应的逾期类型作为待识别客户的逾期风险预测结果,由此本申请中在进行客户逾期风险预测时采用不同客户群体数据训练得到的目标逾期风险预测模型对其进行处理,相比于现有技术采用单一的逾期模型,本申请中基于若干个不同逾期类型的目标逾期风险预测模型的预测结果可实现对客户逾期风险的精准预测。

Description

逾期风险识别方法、装置、设备及存储介质
技术领域
本申请涉及人工智能技术领域,尤其涉及一种逾期风险识别方法、装置、设备及存储介质。
背景技术
随着我国消费信贷产业的蓬勃发展,信用卡、住房贷款、汽车贷款、消费品贷款等各类贷款产品层出不穷,越来越多的贷款机构加入这一行业,包括银行、小贷公司、互联网金融机构等等。
贷款申请人获得每一笔贷款后,需在指定时间点按时还款。但在实际业务开展中,往往存在一部分逾期未还的用户,在市面上的各家企业中,随着办理借款的人越来越多,出现逾期的现象也越来越突出,例如用户在使用信用卡时,信用卡要求在规定的还款日前按时还款,若未能及时还款,金融机构将收取一定的利息,然而金融机构也面临着客户因逾期而利益受损。为了降低金融风险,快速准确的识别逾期客户是一种较为常见的人工智能的应用领域。
现有技术方案中,在采用人工智能进行逾期客户识别时,通常仅依靠单一的逾期模型,然而由于客户特征的复杂多变性,仅依靠单一的逾期模型进行逾期预测,难以实现对所有客户全生命周期的精准预测和评估。
发明内容
本申请提供一种逾期风险识别方法、装置、设备及存储介质,用以解决现有技术中使用单一的逾期模型进行逾期预测,导致预测结果不精准的缺陷。
本申请提供一种逾期风险识别方法,包括:
基于待识别客户的特征数据构建出所述待识别客户的多维度特征标签,所述特征数据包括交易行为数据及客户信息数据;
将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类所述目标逾期风险预测模型输出的逾期预测概率;
确定所述逾期预测概率中概率值最大的目标逾期预测概率,并将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果;
其中,各类所述目标逾期风险预测模型分别是基于不同逾期类型的客户群体数据训练得到的。
根据本申请提供的一种逾期风险识别方法,所述将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型之前,还包括:
从数据库中选取若干个目标客户;
基于各所述目标客户的目标特征数据对所述目标客户进行用户画像,得到多维度的用户画像特征;
基于所述多维度的用户画像特征对所述若干个目标客户进行聚类,得到多个不同逾期类型的目标客户群体;
分别基于各类所述目标客户群体训练初始逾期风险预测模型,得到各类所述目标客户群体对应的目标逾期风险预测模型。
根据本申请提供的一种逾期风险识别方法,所述从数据库中选取若干个目标客户,包括:
从数据库中选取在第一时间阶段内未出现逾期行为的若干个样本客户;
从所述若干个样本客户中选取在第二时间阶段内出现逾期行为的客户作为目标客户。
根据本申请提供的一种逾期风险识别方法,所述基于所述多维度的用户画像特征对所述若干个目标客户进行聚类,得到多个不同逾期类型的目标客户群体,包括:
确定最优聚类簇数;
基于所述多维度的用户画像特征将所述若干个目标客户聚类成所述最优聚类簇数个不同逾期类型的目标客户群体。
根据本申请提供的一种逾期风险识别方法,所述基于所述多维度的用户画像特征对所述若干个目标客户进行聚类之前,还包括:
依次对所述多维度的用户画像特征进行数据清洗及特征工程处理。
根据本申请提供的一种逾期风险识别方法,所述多维度的用户画像特征包括客户特征、消费行为特征、分期行为特征、应用程序行为特征及借记卡行为特征。
根据本申请提供的一种逾期风险识别方法,所述将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果之后,还包括:
在获取所述待识别客户的真实逾期风险识别结果的情况下,计算出所述真实逾期风险识别结果与所述逾期风险预测结果之间的偏差值;
在所述偏差值超出预设偏差限值的情况下,从数据库中选取与所述待识别客户的特征数据相似度达到预设相似度的目标历史特征数据;
基于所述目标历史特征数据训练初始逾期风险预测模型,得到所述待识别客户对应的逾期类型的目标逾期风险预测模型。
本申请还提供一种逾期风险识别装置,包括:
构建单元,用于基于待识别客户的特征数据构建出所述待识别客户的多维度特征标签,所述特征数据包括交易行为数据及客户信息数据;
预测单元,用于将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类所述目标逾期风险预测模型输出的逾期预测概率;
确定单元,用于确定所述逾期预测概率中概率值最大的目标逾期预测概率,并将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果;
其中,各类所述目标逾期风险预测模型分别是基于不同逾期类型的客户群体数据训练得到的。
本申请还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述逾期风险识别方法。
本申请还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述逾期风险识别方法。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述逾期风险识别方法。
本申请提供的逾期风险识别方法、装置、设备及存储介质,通过基于待识别客户的特征数据构建出待识别客户的多维度特征标签,特征数据包括交易行为数据及客户信息数据;将多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类目标逾期风险预测模型输出的逾期预测概率;确定逾期预测概率中概率值最大的目标逾期预测概率,并将目标逾期预测概率及目标逾期预测概率对应的逾期类型作为待识别客户的逾期风险预测结果;其中,各类目标逾期风险预测模型分别是基于不同逾期类型的客户群体数据训练得到的,由此本申请中在进行客户逾期风险预测时,采用多种不同客户群体数据训练得到的目标逾期风险预测模型对其进行处理,相比于现有技术中采用单一的逾期模型,本申请中基于若干个不同逾期类型的目标逾期风险预测模型的预测结果可实现对客户逾期风险的精准预测。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的逾期风险识别方法的流程示意图之一;
图2是本发明提供的逾期风险识别装置的结构示意图;
图3是本申请提供的电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有技术方案中,为了降低金融风险,需要快速识别出逾期风险客户从而对其进行相关的风险管控,通常采用使用大量的训练样本去训练相同的逾期预测模型,之后使用该逾期预测模型去识别评估所有的客户。
然而由于在实际应用中,各客户逾期因素、逾期动机、逾期金额等复杂多变,仅依靠单一的逾期预测模型进行逾期预测,难以实现对所有客户全生命周期的精准预测和评估。
因此为了解决现有技术中使用单一的逾期模型进行逾期预测,导致预测结果不精准的缺陷,本申请提供一种逾期风险识别方法,其执行主体可以为任何一种可实现逾期风险识别方法的移动终端或移动终端中的功能模块等,本申请提及的移动终端包括但不限于手机、平板电脑、电脑、可穿戴设备等,下面以移动终端作为执行主体为例对本申请提供的逾期风险识别方法进行说明。需要说明的是,上述执行主体并不构成对本申请的限制。
下面结合图1描述本申请的逾期风险识别方法,图1为本申请提供的逾期风险识别方法的流程示意图,如图1所示,本申请提供了一种逾期风险识别方法,包括:
步骤101,基于待识别客户的特征数据构建出所述待识别客户的多维度特征标签,所述特征数据包括交易行为数据及客户信息数据;
具体地,交易行为数据主要包括消费行为数据、分期行为数据、应用程序行为数据、借记卡行为数据等,客户信息数据指代客户的年龄、学历、职业、婚姻状态、收入、开户行、开户年限、信用限额等信息数据。
其中,消费行为数据指代客户账单周期内的消费金额变化趋势、频繁消费的时间区间、频繁消费的金额区间、是否存在大额消费行为、大额消费频次、消费信用限额变化率、消费信用限额使用率等。
分期行为数据指代客户是否办理分期业务、分期代还笔数及金额、当前消费账单周期内是否新增分期、办理新增分期的时间区段、新增分期的笔数及金额等。
应用程序行为数据指代在消费账户周期内客户是否启动应用程序浏览或点击分期相关页面、浏览时间段等。
借记卡行为数据指代客户的借记卡余额情况、客户的借记卡余额变化趋势等。
该步骤中,在采集到待识别客户以上至少一种特征数据之后,对特征数据进行数据清洗及特征工程处理,得到其对应的多维度特征标签,例如该客户为高薪职业者,收入在A元以上、开户年限长达5 年、信用限额不低于B元,且账单周期内的消费金额呈上升趋势、凌晨频繁消费、存在超C元的大额消费、近期申请提高信用卡额度、月信用限额使用率呈上升趋势、未办理过分期业务、浏览或点击分期相关页面频次处于第N频次区间、借记卡余额处于第M区间。
步骤102,将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类所述目标逾期风险预测模型输出的逾期预测概率;
需要说明的是,若干个不同逾期类型的目标逾期风险预测模型所匹配的客户群体不同,例如对于逾期类型为Y1且办理分期业务的目标逾期风险预测模型来说,其预测逾期类型为Y1且办理分期业务的客户群体a最精准,换句话说,对于预测逾期类型为Y1且办理分期业务的客户群体a来说,其使用逾期类型为Y1且办理分期业务的目标逾期风险预测模型处理后的逾期预测概率更大,预测结果更精准。
该步骤中,将待识别客户的多维度特征标签均输入至若干个不同逾期类型的目标逾期风险预测模型中进行处理,以使根据若干个不同逾期类型的目标逾期风险预测模型确定该待识别客户所属的客户群体及预测结果。
步骤103,确定所述逾期预测概率中概率值最大的目标逾期预测概率,并将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果;
其中,各类所述目标逾期风险预测模型分别是基于不同逾期类型的客户群体数据训练得到的。
该步骤中,当目标逾期风险预测模型输出的目标逾期预测概率值越大,则表明待识别客户与该目标逾期风险预测模型对应的逾期类型的客户群体之间越相似,因此本实施例中选取概率值最大的目标逾期预测概率及目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果。
本实施例中在逾期风险识别过程中,由此相比于现有技术中采用单一的逾期模型进行预测评估,采用多种不同客户群体数据训练得到的目标逾期风险预测模型对其进行处理,本申请中基于若干个不同逾期类型的目标逾期风险预测模型的预测结果可实现对客户逾期风险的精准预测。
基于以上实施例,所述将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型之前,还包括:
从数据库中选取若干个目标客户;
基于各所述目标客户的目标特征数据对所述目标客户进行用户画像,得到多维度的用户画像特征;
基于所述多维度的用户画像特征对所述若干个目标客户进行聚类,得到多个不同逾期类型的目标客户群体;
分别基于各类所述目标客户群体训练初始逾期风险预测模型,得到各类所述目标客户群体对应的目标逾期风险预测模型。
其中,目标客户指代客户的交易行为数据中符合存在逾期风险特征数据的客户。
该步骤中,在选取出目标客户之后,根据目标客户的目标特征数据将他们区分为不同逾期类型的目标客户群体。
具体地,在实际应用中,根据目标特征数据的数值分布及特点,将数据进行标签化,之后使用多维度的用户画像特征。
其中,本实施例中多维度的用户画像特征包括客户特征、消费行为特征、分期行为特征、应用程序行为特征及借记卡行为特征,例如目标客户为高收入已婚中年人,收入在A元以上、开户年限长达5 年、信用限额不低于B元,且账单周围内的消费金额变为趋势上升、凌晨频繁消费、存在超C元的大额消费、近期申请提高信用卡额度、月信用限额使用率呈上升趋势、未办理过分期业务、浏览或点击分期相关页面频次处于第N频次区间、借记卡余额处于第M区间。由此可以通过以上若干个多维度的用户画像特征对目标客户进行分类。
此外,本实施例中,初始逾期风险预测模型可以为XGBoost、 LightGBM、CatBoost等分类算法模型,输入的为各类目标客户群体的多维度的用户画像特征,输出为其分类后的逾期类型及概率权重。
具体地,在训练过程中,使用验证集参数对模型的参数通过网格搜索不断迭代优化,最终选择在训练集和验证集上均表现最优的模型,从而实现对不同逾期类型客户的精准预测。
具体地,本实施例中训练初始逾期风险预测模型的过程中,模型输入为多维度的用户画像特征,输出为分类之后得到的逾期或非逾期相关的预测概率、逾期类型相关的预测概率,在此不再赘述。
由此,本实施例中针对不同逾期类型的目标客户群体分别进行相应的模型训练,从而使得训练后得到的若干个不同逾期类型的目标逾期风险预测模型实现对不同逾期类型客户的精准预测。
基于以上实施例,所述从数据库中选取若干个目标客户,包括:
从数据库中选取在第一时间阶段内未出现逾期行为的若干个样本客户;
从所述若干个样本客户中选取在第二时间阶段内出现逾期行为的样本客户作为目标客户。
本实施例中,为了提高客户逾期预测的精准性,在选取用于训练模型的训练数据时,选取消费行为数据发生变化的客户作为样本客户。
其中,第一时间阶段与第二时间阶段是连续的两个时间阶段,例如第一时间阶段为a~b,则第二时间阶段为b~c。
具体地,先从数据库中选取出在第一时间阶段内未出现逾期行为的若干个样本客户,接着再从若干个样本客户中选取在第二时间阶段内出现逾期行为的客户作为目标客户,由此筛选出具备存在逾期风险特征的目标客户。
进一步地,由于用户的逾期行为可能是基于一些营销节日活动、用户对于超前消费的适应度等因素的影响,因此本实施例中第一时间阶段可以为不包含营销节日活动的时间阶段,第二时间阶段为包含营销节日活动的时间阶段,且第二时间阶段的时间周期大于第一时间阶段的时间周期。
此外,需要说明的是,为了避免样本不均衡,无法反映样本全局特征,本实施例中,在选取出出现逾期行为的目标客户之后,从数据库中筛选出对应若干数量个在第二时间阶段内未出现逾期行为的样本客户也作为目标客户,由此均衡目标客户中逾期客户与非逾期客户的数据比。
由此本实施例中,在选取目标客户时,通过两次筛选均衡样本分布的平衡性,使得后期训练好的模型的精准性更佳。
基于以上实施例,所述基于所述多维度的用户画像特征对所述若干个目标客户进行聚类,得到多个不同逾期类型的目标客户群体,包括:
确定最优聚类簇数;
基于所述多维度的用户画像特征将所述若干个目标客户聚类成所述最优聚类簇数个不同逾期类型的目标客户群体。
优选地,采用K均值聚类算法,该算法的主要作用是将相似的样本自动归到一个类别中。
本实施例中,在采用K均值聚类算法进行聚类时,通过样本离最近聚类中心的总和最小来选择最优聚类簇数k,该步骤中,首先随机选取出k个聚类中心,之后计算每一个对象到每一个聚类中心的欧式距离来分配各对象所属的类簇,接着根据一个类簇内的所有点重新计算该类簇的中心点,然后再迭代的进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,或者达到指定的迭代次数,由此将若干个目标客户聚类成k类簇个不同逾期类型的目标客户群体。
基于以上实施例,所述基于所述多维度的用户画像特征对所述若干个目标客户进行聚类之前,还包括:
依次对所述多维度的用户画像特征进行数据清洗及特征工程处理。
该步骤中,为了提高数据质量,降低模型训练所需要的时间,在进行聚类之前,还需依次对数据进行数据清洗及特征工程处理。
其中,数据清洗主要包括缺失值填充、重复值剔除及异常值检测。
特征工程是用一系列工程化的方式从原始数据中筛选出更好的数据特征,以提升模型的训练效果,具体包括:对特征进行标准化、归一化、连续特征离散化、特征编码等。
具体地,数据清洗及特征工程处理与现有技术方案中的处理过程一致,在此不再赘述。
基于以上实施例,所述将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果之后,还包括:
在获取所述待识别客户的真实逾期风险识别结果的情况下,计算出所述真实逾期风险识别结果与所述逾期风险预测结果之间的偏差值;
在所述偏差值超出预设偏差限值的情况下,从数据库中选取与所述待识别客户的特征数据相似度达到预设相似度的目标历史特征数据;
基于所述目标历史特征数据训练初始逾期风险预测模型,得到所述待识别客户对应的逾期类型的目标逾期风险预测模型。
该步骤中,由于客户特征的复杂多变性,因此本实施例中在使用之前训练好的若干个不同逾期类型的目标逾期风险预测模型得到的逾期风险预测结果与之后客户真实逾期风险识别结果之间的偏差值过大时,表明可能出现了一种新的逾期类型的客户群体。
因此本实施例中,采用与待识别客户的特征数据相似度达到预设相似度的目标历史特征数据重新训练初始逾期风险预测模型,由此增添该待识别客户对应的逾期类型的目标逾期风险预测模型来实现对所有客户全生命周期的精准预测和评估。
下面对本申请提供的逾期风险识别装置进行描述,下文描述的逾期风险识别装置与上文描述的逾期风险识别方法可相互对应参照。
参照图2,图2是本申请提供的逾期风险识别装置的结构示意图,如图2所示,所述逾期风险识别装置包括:构建单元210,用于基于待识别客户的特征数据构建出所述待识别客户的多维度特征标签,所述特征数据包括交易行为数据及客户信息数据;预测单元220,用于将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类所述目标逾期风险预测模型输出的逾期预测概率;确定单元230,用于确定所述逾期预测概率中概率值最大的目标逾期预测概率,并将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果;其中,各类所述目标逾期风险预测模型分别是基于不同逾期类型的客户群体数据训练得到的。
进一步地,所述预测单元220,还用于从数据库中选取若干个目标客户;基于各所述目标客户的目标特征数据对所述目标客户进行用户画像,得到多维度的用户画像特征;基于所述多维度的用户画像特征对所述若干个目标客户进行聚类,得到多个不同逾期类型的目标客户群体;分别基于各类所述目标客户群体训练初始逾期风险预测模型,得到各类所述目标客户群体对应的目标逾期风险预测模型。
进一步地,所述预测单元220,还用于从数据库中选取在第一时间阶段内未出现逾期行为的若干个样本客户;从所述若干个样本客户中选取在第二时间阶段内出现逾期行为的样本客户作为目标客户。
进一步地,所述预测单元220,还用于确定最优聚类簇数;基于所述多维度的用户画像特征将所述若干个目标客户聚类成所述最优聚类簇数个不同逾期类型的目标客户群体。
进一步地,所述预测单元220,还用于依次对所述多维度的用户画像特征进行数据清洗及特征工程处理。
进一步地,所述多维度的用户画像特征包括客户特征、消费行为特征、分期行为特征、应用程序行为特征及借记卡行为特征。
进一步地,所述确定单元230,还用于在获取所述待识别客户的真实逾期风险识别结果的情况下,计算出所述真实逾期风险识别结果与所述逾期风险预测结果之间的偏差值;在所述偏差值超出预设偏差限值的情况下,从数据库中选取与所述待识别客户的特征数据相似度达到预设相似度的目标历史特征数据;基于所述目标历史特征数据训练初始逾期风险预测模型,得到所述待识别客户对应的逾期类型的目标逾期风险预测模型。
本实施例提供的逾期风险识别装置,通过基于待识别客户的特征数据构建出待识别客户的多维度特征标签,特征数据包括交易行为数据及客户信息数据;将多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类目标逾期风险预测模型输出的逾期预测概率;确定逾期预测概率中概率值最大的目标逾期预测概率,并将目标逾期预测概率及目标逾期预测概率对应的逾期类型作为待识别客户的逾期风险预测结果;其中,各类目标逾期风险预测模型分别是基于不同逾期类型的客户群体数据训练得到的,由此本申请中在进行客户逾期风险预测时,采用多种不同客户群体数据训练得到的目标逾期风险预测模型对其进行处理,相比于现有技术中采用单一的逾期模型,本申请中基于若干个不同逾期类型的目标逾期风险预测模型的预测结果可实现对客户逾期风险的精准预测。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行逾期风险识别方法,该方法包括:基于待识别客户的特征数据构建出所述待识别客户的多维度特征标签,所述特征数据包括交易行为数据及客户信息数据;将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类所述目标逾期风险预测模型输出的逾期预测概率;确定所述逾期预测概率中概率值最大的目标逾期预测概率,并将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果;其中,各类所述目标逾期风险预测模型分别是基于不同逾期类型的客户群体数据训练得到的。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的逾期风险识别方法,该方法包括:基于待识别客户的特征数据构建出所述待识别客户的多维度特征标签,所述特征数据包括交易行为数据及客户信息数据;将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类所述目标逾期风险预测模型输出的逾期预测概率;确定所述逾期预测概率中概率值最大的目标逾期预测概率,并将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果;其中,各类所述目标逾期风险预测模型分别是基于不同逾期类型的客户群体数据训练得到的。
又一方面,本申请还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的逾期风险识别方法,该方法包括:基于待识别客户的特征数据构建出所述待识别客户的多维度特征标签,所述特征数据包括交易行为数据及客户信息数据;将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类所述目标逾期风险预测模型输出的逾期预测概率;确定所述逾期预测概率中概率值最大的目标逾期预测概率,并将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果;其中,各类所述目标逾期风险预测模型分别是基于不同逾期类型的客户群体数据训练得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种逾期风险识别方法,其特征在于,包括:
基于待识别客户的特征数据构建出所述待识别客户的多维度特征标签,所述特征数据包括交易行为数据及客户信息数据;
将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类所述目标逾期风险预测模型输出的逾期预测概率;
确定所述逾期预测概率中概率值最大的目标逾期预测概率,并将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果;
其中,各类所述目标逾期风险预测模型分别是基于不同逾期类型的客户群体数据训练得到的。
2.根据权利要求1所述的逾期风险识别方法,其特征在于,所述将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型之前,还包括:
从数据库中选取若干个目标客户;
基于各所述目标客户的目标特征数据对所述目标客户进行用户画像,得到多维度的用户画像特征;
基于所述多维度的用户画像特征对所述若干个目标客户进行聚类,得到多个不同逾期类型的目标客户群体;
分别基于各类所述目标客户群体训练初始逾期风险预测模型,得到各类所述目标客户群体对应的目标逾期风险预测模型。
3.根据权利要求2所述的逾期风险识别方法,其特征在于,所述从数据库中选取若干个目标客户,包括:
从数据库中选取在第一时间阶段内未出现逾期行为的若干个样本客户;
从所述若干个样本客户中选取在第二时间阶段内出现逾期行为的客户作为目标客户。
4.根据权利要求2所述的逾期风险识别方法,其特征在于,所述基于所述多维度的用户画像特征对所述若干个目标客户进行聚类,得到多个不同逾期类型的目标客户群体,包括:
确定最优聚类簇数;
基于所述多维度的用户画像特征将所述若干个目标客户聚类成所述最优聚类簇数个不同逾期类型的目标客户群体。
5.根据权利要求2所述的逾期风险识别方法,其特征在于,所述基于所述多维度的用户画像特征对所述若干个目标客户进行聚类之前,还包括:
依次对所述多维度的用户画像特征进行数据清洗及特征工程处理。
6.根据权利要求2所述的逾期风险识别方法,其特征在于,所述多维度的用户画像特征包括客户特征、消费行为特征、分期行为特征、应用程序行为特征及借记卡行为特征。
7.根据权利要求1至6任一项所述的逾期风险识别方法,其特征在于,所述将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果之后,还包括:
在获取所述待识别客户的真实逾期风险识别结果的情况下,计算出所述真实逾期风险识别结果与所述逾期风险预测结果之间的偏差值;
在所述偏差值超出预设偏差限值的情况下,从数据库中选取与所述待识别客户的特征数据相似度达到预设相似度的目标历史特征数据;
基于所述目标历史特征数据训练初始逾期风险预测模型,得到所述待识别客户对应的逾期类型的目标逾期风险预测模型。
8.一种逾期风险识别装置,其特征在于,包括:
构建单元,用于基于待识别客户的特征数据构建出所述待识别客户的多维度特征标签,所述特征数据包括交易行为数据及客户信息数据;
预测单元,用于将所述多维度特征标签输入预先训练好的若干个不同逾期类型的目标逾期风险预测模型,获取各类所述目标逾期风险预测模型输出的逾期预测概率;
确定单元,用于确定所述逾期预测概率中概率值最大的目标逾期预测概率,并将所述目标逾期预测概率及所述目标逾期预测概率对应的逾期类型作为所述待识别客户的逾期风险预测结果;
其中,各类所述目标逾期风险预测模型分别是基于不同逾期类型的客户群体数据训练得到的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述逾期风险识别方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述逾期风险识别方法。
CN202211167464.2A 2022-09-23 2022-09-23 逾期风险识别方法、装置、设备及存储介质 Pending CN115545886A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211167464.2A CN115545886A (zh) 2022-09-23 2022-09-23 逾期风险识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211167464.2A CN115545886A (zh) 2022-09-23 2022-09-23 逾期风险识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115545886A true CN115545886A (zh) 2022-12-30

Family

ID=84729251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211167464.2A Pending CN115545886A (zh) 2022-09-23 2022-09-23 逾期风险识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115545886A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116308763A (zh) * 2023-05-19 2023-06-23 北京泛钛客科技有限公司 基于卷积自编码器的车贷贷后风险预测方法及系统
CN116862078A (zh) * 2023-09-04 2023-10-10 杭州宇谷科技股份有限公司 一种换电套餐用户逾期的预测方法、系统、装置及介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116308763A (zh) * 2023-05-19 2023-06-23 北京泛钛客科技有限公司 基于卷积自编码器的车贷贷后风险预测方法及系统
CN116308763B (zh) * 2023-05-19 2023-09-12 北京泛钛客科技有限公司 基于卷积自编码器的车贷贷后风险预测方法及系统
CN116862078A (zh) * 2023-09-04 2023-10-10 杭州宇谷科技股份有限公司 一种换电套餐用户逾期的预测方法、系统、装置及介质
CN116862078B (zh) * 2023-09-04 2023-12-12 杭州宇谷科技股份有限公司 一种换电套餐用户逾期的预测方法、系统、装置及介质

Similar Documents

Publication Publication Date Title
CN110837931B (zh) 客户流失预测方法、装置及存储介质
CN110188198B (zh) 一种基于知识图谱的反欺诈方法及装置
US11423365B2 (en) Transaction card system having overdraft capability
CN111291816A (zh) 针对用户分类模型进行特征处理的方法及装置
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
US8984022B1 (en) Automating growth and evaluation of segmentation trees
US11055772B1 (en) Instant lending decisions
CN104321794A (zh) 一种使用多维评级来确定一实体的未来商业可行性的系统和方法
CN110930038A (zh) 一种贷款需求识别方法、装置、终端及存储介质
US11037236B1 (en) Algorithm and models for creditworthiness based on user entered data within financial management application
CN112950359B (zh) 一种用户识别方法和装置
CN110689437A (zh) 一种基于随机森林的通信施工项目财务风险预测方法
CN111667307B (zh) 一种理财产品销量的预测方法及装置
Hsieh et al. Enhancing consumer behavior analysis by data mining techniques
CN112950347A (zh) 资源数据处理的优化方法及装置、存储介质、终端
CN112487284A (zh) 银行客户画像生成方法、设备、存储介质及装置
CN114626940A (zh) 数据分析方法、装置及电子设备
CN114612239A (zh) 基于算法、大数据、人工智能的股票舆情监测和风控系统
CN114493686A (zh) 一种运营内容生成推送方法及装置
CN113052512A (zh) 风险预测方法、装置和电子设备
CN113269629A (zh) 授信额度确定方法、电子设备及相关产品
Olson et al. Data mining process
CN112950392A (zh) 信息展示方法、后验信息确定方法及装置及相关设备
CN117764692A (zh) 一种用于预测信用风险违约概率的方法
CN117788133A (zh) 构建零售信用风险预测模型的方法和零售信贷Scoresigma模型

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination