CN116645200A - 风险预测方法、装置、电子设备及计算机可读存储介质 - Google Patents
风险预测方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN116645200A CN116645200A CN202310714042.0A CN202310714042A CN116645200A CN 116645200 A CN116645200 A CN 116645200A CN 202310714042 A CN202310714042 A CN 202310714042A CN 116645200 A CN116645200 A CN 116645200A
- Authority
- CN
- China
- Prior art keywords
- term
- long
- risk
- client
- short
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000007774 longterm Effects 0.000 claims abstract description 272
- 230000006866 deterioration Effects 0.000 claims abstract description 228
- 238000013058 risk prediction model Methods 0.000 claims abstract description 96
- 238000012549 training Methods 0.000 claims abstract description 82
- 230000006399 behavior Effects 0.000 claims description 116
- 230000015556 catabolic process Effects 0.000 claims description 34
- 238000006731 degradation reaction Methods 0.000 claims description 34
- 238000013508 migration Methods 0.000 claims description 7
- 230000005012 migration Effects 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 13
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000004590 computer program Methods 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000003066 decision tree Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000007477 logistic regression Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请应用于金融科技领域,公开了一种风险预测方法、装置、电子设备及计算机可读存储介质,风险预测方法包括:获取源长期风险预测模型,其中,所述源长期风险预测模型由前期客户在第一观察点的短期变坏风险,以及前期客户的前期客户行为信息训练得到;确定近期客户在第二观察点的近期短期变坏规则,其中,所述前期客户的开通时间点在所述近期客户的开通时间点之前;将所述近期短期变坏规则迁移到所述源长期风险预测模型,并更新所述源长期风险预测模型,得到目标长期风险模型,其中,所述目标长期风险模型用于对近期客户进行预测以确定近期客户的长期变坏风险。本申请旨在解决现有风控模型对近期客户的长期变坏风险的预测效果差的技术问题。
Description
技术领域
本申请属于金融科技技术领域,涉及一种风险预测方法、装置、电子设备及计算机可读存储介质。
背景技术
金融机构在构建审批场景的风控模型时,往往需要构建长表现期的模型。因为很多客户在开通时或首借时不会快速走向不良,需要一定时间表现才能确定客户是否会转化为不良客户,其中,不良客户为在表现期内表现不良的客户,也即坏客户。业务会依据风控模型做风险准入,确定准入策略,也即对客户进行好坏筛查,而判定客户是否为坏客户的条件可能会随着时间的推移而发生变化,所以在准入策略使用一段时间后,风控模型对好坏客户的预测可能不够准确,从而导致风控模型在长期使用时的预测效果下降,也即,风控模型对在表现期内近期客户的预测效果差。
发明内容
本申请的主要目的在于提供一种风险预测方法,旨在解决现有风控模型对近期客户的长期变坏风险的预测效果差的技术问题。
为实现上述目的,本申请提供一种风险预测方法,所述风险预测方法包括:
获取源长期风险预测模型,其中,所述源长期风险预测模型由前期客户在第一观察点的短期变坏风险,以及前期客户的前期客户行为信息训练得到;
确定近期客户在第二观察点的近期短期变坏规则,其中,所述前期客户的开通时间点在所述近期客户的开通时间点之前;
将所述近期短期变坏规则迁移到所述源长期风险预测模型,并更新所述源长期风险预测模型,得到目标长期风险模型,其中,所述目标长期风险模型用于对近期客户进行预测以确定近期客户的长期变坏风险。
为实现上述目的,本申请提供一种风险预测装置,所述风险预测装置包括:
源域模型获取模块,用于获取源长期风险预测模型,其中,所述源长期风险预测模型由前期客户在第一观察点的短期变坏风险,以及前期客户的前期客户行为信息训练得到;
规则确定模块,用于确定近期客户在第二观察点的近期短期变坏规则,其中,所述前期客户的开通时间点在所述近期客户的开通时间点之前;
规则迁移模块,用于将所述近期短期变坏规则迁移到所述源长期风险预测模型,并更新所述源长期风险预测模型,得到目标长期风险模型,其中,所述目标长期风险模型用于对近期客户进行预测以确定近期客户的长期变坏风险。
本申请还提供一种电子设备,所述电子设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述风险预测方法的程序,所述风险预测方法的程序被处理器执行时可实现如上述的风险预测方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实现风险预测方法的程序,所述风险预测方法的程序被处理器执行时实现如上述的风险预测方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的风险预测方法的步骤。
本申请提供了一种风险预测方法、装置、电子设备及计算机可读存储介质,本申请获取源长期风险预测模型,其中,所述源长期风险预测模型由前期客户在第一观察点的短期变坏风险,以及前期客户的前期客户行为信息训练得到;确定近期客户在第二观察点的近期短期变坏规则,其中,所述前期客户的开通时间点在所述近期客户的开通时间点之前;将所述近期短期变坏规则迁移到所述源长期风险预测模型,并更新所述源长期风险预测模型,得到目标长期风险模型,其中,所述目标长期风险模型用于对近期客户进行预测以确定近期客户的长期变坏风险。
本申请中通过确定源长期风险预测模型,其中,源长期风险预测模型可以预测前期客户的长期变坏风险,由于源长期风险预测模型是基于前期客户的前期客户行为信息生成的,而预测前期客户的长期变坏风险的规则和预测近期客户的长期变坏风险的规则可能会发生变化,所以源长期风险预测模型在预测前期客户的长期变坏风险时的准确率较高,预测近期客户的长期风险准确率低,从而需要确定近期客户在第二观察点的近期短期变坏规则,并将近期客户的近期短期变坏规则迁移到源长期风险预测模型,得到目标长期风险模型,通过目标长期风险模型对近期客户的长期变坏风险进行预测,可以提高预测近期客户的长期变坏风险的准确度,进一步的,直接将近期客户的近期短期变坏规则迁移到源长期风险预测模型,得到目标长期风险模型,减少了目标长期风险模型的训练时间和训练量,提高了对近期客户的长期变坏风险的预测效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,表示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请风险预测方法第一实施例的流程示意图;
图2为本申请风险预测方法第二实施例的流程示意图;
图3为本申请风险预测方法的一实施例生成源长期风险预测模型的流程流向示意图;
图4为本申请风险预测方法第三实施例的流程示意图;
图5为本申请风险预测方法的一实施例中生成目标长期风险模型的流程示意图;
图6为本申请风险预测方法一实施例的装置示意图;
图7为本申请实施例中风险预测方法涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
在构建审批场景的风控模型时,往往需要构建长表现期的风控模型。因为很多用户在开通/首借时点不会快速走向不良,需要一定时间表现转化为不良客户。在风控领域常常通过vintage(账龄分析)曲线找到累计不良的人数达到平稳的拐点,并将开通首借距离拐点的月份数作为风控模型的表现期。这种方式可以保证在相对比较近期的建模月份下挖掘到覆盖相对全面的坏客户。一般审批场景的风险模型表现期为9-15个月之间,坏客户定义往往为表现期间不良的客户。
在审批场景中,业务会依据风控模型做风险准入,而基于最新风控模型制定的新的准入策略使用一段时间后,风控模型识别出的坏客户会被准入策略拒绝,使得风控模型在长期使用时的预测效果下降,也即,当风控模型上线,对风控模型进行实际跟踪后,发现风控模型对近期客户长期变坏风险预测效果较差。为了尽可能降低新的准入策略对风控模型的影响,往往会考虑近期客户画像作为目标域,将目标域的近期客户迁移到的源域中的建模场景。常用的迁移学习方法有Tradaboost和Transboost等。Tradaboost和Transboost都是一种迁移学习的算法,Tradaboost和Transboost的主要思想是将近期客户的特征加入到源域的长表现期模型训练中,从而提升模型对于近期客户的识别效果。
Tradaboost模型学习思路是根据源域的客户与目标域的客户的相似度进行加权,将相似度更高的客群赋予更大的权重进行建模,得到Tradaboost风控模型,但目标域中的客户大多为好客户,源域的客户和目标域客户相似度高,所以Tradaboost风控模型难以学习到目标域中坏客户的条件,导致Tradaboost风控模型的预测效果差,难以准确预测近期客户的长期变坏风险。而Transboost模型引入目标域中的好坏客户定义,通过学习公共的树结构,将目标域和源域中短期坏客户的条件都兼顾在内。虽然Transboost模型中兼顾了目标域和源域中短期的坏客户条件,但对客户的长期变坏风险的预测仍不够准确。其中,源域包括了预设表现期内预设前期的前期客户,目标区域包括了预设表现期内预设近期的近期客户。
为使本申请的上述目的、特征和优点能够更加明显易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本申请保护的范围。
实施例一
参照图1,本申请实施例提供一种风险预测方法,在本申请风险预测方法的第一实施例中,所述风险预测方法包括:
步骤S10,获取源长期风险预测模型,其中,所述源长期风险预测模型由前期客户在第一观察点的短期变坏风险,以及前期客户的前期客户行为信息训练得到;
在本实施例中,需要说明的是,本申请应用于风险预测场景,在风险预测场景中一般会构建风控模型,而风控模型是基于在表现期内构建的,所述源长期风险预测模型就可以是一个风控模型,源长期风险预测模型是基于预设表现期内的客户信息构建的,所述预设表现期可以是9个月到15个月之间,所述前期客户为在预设表现期内预设前期的客户,所述预设前期可以由用户自定义设置,所述第一观察点有对应的第一短表现期,所述第一短表现期为在预设表现期的部分表现期,所述前期客户的前期客户行为信息为在所述第一观察点可获得的所述前期客户的行为信息,所述前期客户行为信息可以为第一观察点的第一短表现期内的前期客户的行为信息,所述前期客户行为信息可以为第一观察点的到当前时间点的前期客户的行为信息,所述前期客户行为信息可以是前期客户的借贷行为信息,其中,所述前期客户的长期变坏风险是指所述前期客户在长表现期内变坏的概率,所长表现期的范围可以基于实际情况设置。
所述前期客户的前期客户行为信息用于提供预测前期客户长期变坏风险的依据,所述长表现期为在预设表现期内的较长一段时间,所述长表现期的时长一般大于第一短表现期,所述短期变坏风险可以表示为概率,所述短期变坏风险用于描述所述前期客户在第一观察点的第一短表现期内为坏客户的概率。例如,当预设表现期为A年1月到A年10月时,预设前期可以为A年1月到A年3月,则前期客户可以为A年1月到A年3月的客户,第一观察点为A年1月,则第一短表现期可以为A年1月到A年3月,再例如,坏客户可以为逾期60天不还款的客户。另外,可以将预设前期中的所有前期客户作为源域,在源域中构建关于前期客户的源长期风险预测模型。
步骤S20,确定近期客户在第二观察点的近期短期变坏规则,其中,所述前期客户的开通时间点在所述近期客户的开通时间点之前;
在本实施例中,需要说明的是,所述近期客户为预设表现期的预设近期的客户,所述预设近期一般为预设表现期中末端的表现期,可以理解的,预设近期为在预设表现期中靠近当前时间点的表现期,所述预设近期的范围可以由用户自定义设置,所述第二观察点有对应的第二短表现期,第一观察点的观察时间点先于第二观察点的观察时间点,所述第二短表现期和所述第一短表现期的观察时长一致,当第二短表现期为近期客户在预设近期的短表现期,第一短表现期为前期客户在预设前期的短表现期,所述第一短表现期的观察时间点先于第二短表现期的观察时间点,所述近期短期变坏规则用于描述预设近期的近期客户的变坏规则,所述近期短期变坏规则可以用决策树表示。另外,可以将预设近期内的近期客户作为目标域,在目标域中确定近期客户的近期短期变坏规则,所述开通时间点为客户进行借贷行为的时间点。
步骤S30,将所述近期短期变坏规则迁移到所述源长期风险预测模型,并更新所述源长期风险预测模型,得到目标长期风险模型,其中,所述目标长期风险模型用于对近期客户进行预测以确定近期客户的长期变坏风险。
在本实施例中,需要说明的是,所述目标长期风险模型用于预测近期客户的长期变坏风险,所述目标长期风险模型是通过迁移学习得到的,其中,所述近期客户的长期变坏风险是指所述近期客户在长表现期内变坏的概率,所长表现期的范围可以基于实际情况设置。
作为一种示例,步骤S10至步骤S30包括:获取源域的源长期风险预测模型,其中,所述源长期风险预测模型由根据前期客户在第一观察点的第一短表现期内变坏的短期变坏风险,以及前期客户的前期客户行为信息训练得到,所述源域为预设表现期内预设前期的前期客户的集合,由于源长期风险预测模型学习到的坏客户规则是基于源域的源域训练样本集训练得到的,所以,源长期风险预测模型对前期客户的长期变坏风险的预测较为准确;确定目标域的近期客户在第二观察点的第二短表现期内变坏的近期短期变坏规则,其中,目标域为预设表现期内预设近期的近期客户的集合,所述近期短期变坏规则用于描述近期客户变坏的条件,可以理解的,所述近期短期变坏规则用于描述近期客户为坏客户条件,所述近期短期变坏规则是基于大量近期客户的近期客户行为信息确定的;进而将所述近期短期变坏规则迁移到所述源长期风险预测模型,并调整所述源长期风险预测模型,得到目标长期风险模型,其中,所述目标长期风险模型用于对近期客户进行预测,以确定近期客户的长期变坏风险。
本申请中通过确定源长期风险预测模型,其中,源长期风险预测模型可以预测前期客户的长期变坏风险,由于源长期风险预测模型是基于前期客户的前期客户行为信息生成的,而预测前期客户的长期变坏风险的规则和预测近期客户的长期变坏风险的规则可能会发生变化,所以源长期风险预测模型在预测前期客户的长期变坏风险时的准确率较高,预测近期客户的长期风险准确率低,从而需要确定近期客户在第二观察点的近期短期变坏规则,并将近期客户的近期短期变坏规则迁移到源长期风险预测模型,得到目标长期风险模型,通过目标长期风险模型对近期客户的长期变坏风险进行预测,可以提高预测近期客户的长期变坏风险的准确度,进一步的,直接将近期客户的近期短期变坏规则迁移到源长期风险预测模型,得到目标长期风险模型,减少了目标长期风险模型的训练时间和训练量,提高了对近期客户的长期变坏风险的预测效率。
实施例二
进一步地,参照图2,基于本申请上述实施例,在本申请另一实施例中,与上述实施例相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,所述获取源长期风险预测模型的步骤包括:
步骤S11,确定所述前期客户在第一观察点的短期变坏风险;
步骤S12,将至少一个所述前期客户的所述短期变坏风险,以及所述前期客户的前期客户行为信息作为源域训练样本集,对预设长表现期预测模型进行训练,得到源长期风险预测模型。
在本实施例中,需要说明的是,所述源域训练样本集中可以包含大量的前期客户的所述短期变坏风险以及所述前期客户的前期客户行为信息,所述预设长表现期预测模型可以是逻辑回归模型、也可以是XGBOOST(分布式梯度增强库)算法或GBDT(GradientBoosting Decision Tree,基于决策树的集成算法)算法。
作为一种示例,步骤S11至步骤S12包括:确定源域中所述前期客户在在第一观察点的第一短表现期内变坏的短期变坏风险;获取源域训练样本集,其中所述源域训练样本集中至少包括一个所述前期客户的所述短期变坏风险,以及所述前期客户的前期客户行为信息,对预设长表现期预测模型进行训练,得到源长期风险预测模型。其中所述源长期风险预测模型可以预测前期客户的长期变坏风险,具体的,将前期客户的前期客户行为信息输入源长期风险预测模型中,源长期风险预测模型基于前期客户行为信息预测前期客户的短期变坏风险(短期变坏概率)再基于短期变坏概率预测前期客户的长期变坏风险。
在本实施例中,通过确定前期客户的短期变坏风险,将前期客户的短期变坏风险以及所述前期客户的前期客户行为信息作为源域训练样本集,进而对预设长表现期预测模型进行训练,得到源长期风险预测模型,使得源长期风险预测模型可以基于短期变坏风险预测长期变坏风险,从而为预测近期客户的长期变坏风险打下基础。
其中,所述确定所述前期客户在第一观察点的短期变坏风险的步骤包括:
步骤S111,获取所述前期客户在第一观察点的前期客户行为信息;
步骤S112,将所述前期客户行为信息输入预设源短期预测模型,预测前期客户在第一观察点的短期变坏的概率,以作为所述前期客户的短期变坏风险。
在本实施例中,需要说明的是,所述前期客户行为信息用于描述所述前期客户在进行借贷时产生的行为,所述前期客户行为信息可以是前期客户的借贷行为信息,其中,前期客户行为信息包括但不限于:前期客户的年龄、性别、借贷金额、逾期天数、行业、还款时间以及信用分等。所述预设源短期预测模型用于预测前期客户在第一观察点的第一短表现期内变坏的预测结果,所述预测结果为前期客户的短期变坏风险。其中,确定所述预设源短期预测模型的步骤可以为:获取一个源短期待训练模型,所述源短期待训练模型可以是逻辑回归模型、也可以是XGBOOST算法或GBDT算法,获取源短期训练样本集,所述源短期训练样本集可以从源域中获取,所述源短期训练样本集包括:至少一个前期客户的前期行为特征以及前期客户短期变坏概率标签;将所述前期行为特征输入源短期待训练模型,根据前期行为特征预测前期客户的短期变坏概率,获得输出前期客户的短期变坏风险,基于所述前期客户的短期变坏风险与所述前期客户短期变坏概率标签计算训练模型损失,所述训练模型损失可以为短期变坏风险与前期客户短期变坏概率标签之间的距离等,判断训练模型损失是否收敛,若所述训练模型损失未收敛,则重新获取新的前期客户的前期行为特征以及前期客户的短期变坏概率标签,并基于所述前期行为特征,重新对所述源短期待训练模型进行训练优化,直至所述训练模型损失收敛,若所述训练模型损失收敛,则将所述源短期待训练模型作为预设源短期预测模型。
作为一种示例,步骤S111至步骤S112包括:在源域中获取前期客户在第一观察点的第一短表现期内的前期客户行为信息,将所述前期客户行为信息输入预设源短期预测模型,所述预设源短期预测模型基于前期客户行为信息预测前期客户在第一观察点的第一短表现期内短期变坏的概率,得到所述前期客户的短期变坏风险。本申请实施例通过对源域中的前期客户的短期变坏风险进行预测,从而可以确定前期客户的坏客户规则,通过源短期预测模型可以实现对前期客户的短期变坏概率进行预测,从而可以得到前期客户的短期变坏风险,从而可以根据短期变坏风险预测前期客户的长期变坏风险。
其中,将至少一个所述前期客户的所述短期变坏风险、前期客户行为信息以及预设长期变坏标签作为源域训练样本集,对预设长表现期预测模型进行训练,得到源长期风险预测模型的步骤包括:
步骤S121,在所述源域训练样本集中获取所述前期客户的所述短期变坏风险以及所述前期客户行为信息;
步骤S122,将所述前期客户的所述短期变坏风险以及所述前期客户行为信息输入所述预设长表现期预测模型,对前期客户的长期变坏风险进行预测,得到长期变坏风险;
步骤S123,计算所述长期变坏风险和所述预设长期变坏标签之间的训练距离,将所述训练距离与预设距离阈值进行比对;
步骤S124,若所述训练距离小于或者等于所述预设距离阈值,则将所述预设长表现期预测模型作为所述源长期风险预测模型;
步骤S125,若所述训练距离大于所述预设距离阈值,则继续根据所述源域训练样本集对所述预设长表现期预测模型进行训练,直至所述训练距离小于或等于所述预设距离阈值。
在本实施例中,需要说明的是,参照图3,图3为源长期风险预测模型的流程流向示意图,所述预设长表现期预测模型可以是逻辑回归模型、也可以是XGBOOST算法或GBDT算法,所述源域训练样本集中可以包括前期客户的短期变坏风险以及前期客户的前期客户行为信息,所述前期客户的前期客户行为信息为所述前期客户在长表现期下的行为信息,所述前期客户行为信息可以为前期客户在长表现期下的逾期天数以及借贷金额。所述训练距离表征为预设长表现期预测模型输出的长期变坏结果与预设长期变坏标签之间的差值,所述训练距离越大所述长期变坏结果与预设长期变坏标签之间的差别越大,所述预设长期变坏标签可以为概率,所述预设长期变坏标签为所述前期客户的真实的长期变坏概率。
作为一种示例,步骤S121至步骤S125包括:在所述源域训练样本集中选择任意一个前期客户的所述短期变坏风险以及前期客户的前期客户行为信息;将所述前期客户的所述短期变坏风险和所述前期客户行为信息输入所述预设长表现预测模型,对前期客户的长期变坏风险进行预测,得到长期变坏结果;计算所述长期变坏结果和所述预设长期变坏标签之间的训练距离,将所述训练距离与所述预设距离阈值进行比对,若所述训练距离小于或者等于所述预设距离阈值,则将所述预设长表现期预测模型作为所述源长期风险预测模型;若所述训练距离大于所述预设距离阈值,则继续根据所述训练样本集对所述预设长表现期预测模型进行训练,直至所述训练距离小于或等于所述预设距离阈值。本申请实施例通过源域训练样本集,对所述预设长表现期预测模型进行训练,得到源长期风险预测模型,使得源长期风险预测模型能够实现对前期客户的长期变坏风险进行预测,为预测近期客户的长期变坏风险打下了基础,使得将近期客户的近期短期变坏规则迁移到源长期风险预测模型后,得到的目标长期风险模型能够实现对近期客户的长期变坏风险进行预测,从而可以提高对近期客户的长期变坏风险预测的准确度。
实施例三
进一步地,参照图4,基于本申请上述实施例,在本申请另一实施例中,与上述实施例相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,所述确定近期客户在第二观察点的近期短期变坏规则的步骤包括:
步骤A10,获取近期客户在第二观察点的近期客户行为信息;
步骤A20,将所述近期客户行为信息输入预设目标短期预测模型,对近期客户行为信息进行分类,得到近期短期变坏规则。
在本实施例中,需要说明的是,所述近期客户行为信息用于描述所述近期客户在进行借贷时产生的行为,其中,近期客户行为信息包括但不限于:近期客户的年龄、性别、借贷金额、逾期天数、还款时间以及信用分等。所述预设目标短期预测模型用于预测近期客户在第二观察点的第二短表现期内变坏的变坏规则,所述近期短期变坏规则可以以决策树的形式表示,例如,近期短期变坏规则可以为:当A客户的信用分为b,行业为c,年龄为d,曾逾期15天以上,则短期变坏概率为x%,其中,短期变坏概率可以通过决策树计算得到,计算A客户在决策树上的概率。所述近期短期变坏规则可以为在目标域中的近期客户为坏客户的条件。其中,确定所述预设目标短期预测模型的步骤包括:获取一个目标短期待训练模型,所述目标短期待训练模型可以是逻辑回归模型、也可以是XGBOOST算法或GBDT算法,获取目标短期训练样本集,所述目标短期训练样本集可以从目标域中获取,所述目标短期训练样本集包括:至少一个近期客户的近期行为特征以及近期客户短期变坏概率标签,将所述前期行为特征输入目标短期待训练模型,根据近期行为特征进行分类,获得多个近期行为分类标签,并基于近期行为分类标签确定近期短期变坏规则,获得近期客户的近期短期变坏规则,基于所述近期客户的近期短期变坏规则与所述近期客户近期短期变坏规则标签计算规则训练损失,所述规则训练损失可以为近期短期变坏规则与近期客户近期短期变坏规则标签之间的距离等,判断规则训练损失是否收敛,若所述规则训练损失未收敛,则重新获取新的近期客户的近期行为特征以及近期客户的近期短期变坏规则标签,并基于所述近期行为特征,重新对所述源短期待训练模型进行训练优化,直至所述规则训练损失收敛,若所述规则训练损失收敛,则将所述源短期待训练模型作为预设目标短期预测模型,进一步的,参照图5,图5为生成目标长期风险模型的流程示意图,首先将近期客户行为信息输入预设短期目标短期预测模型,得到近期客户的近期短期变坏规则,进而将近期短期变坏规则迁移到源长期风险预测模型,更新得到目标长期风险模型。
作为一种示例,步骤A10至步骤A20包括:在目标域中获取近期客户在第二观察点的第二短表现期内的近期客户行为信息,将所述近期客户行为信息输入预设目标短期预测模型,所述预设目标短期预测模型基于近期客户行为信息,对近期客户行为信息进行分类,得到分类结果,将分类结果作为近期短期变坏规则,所述近期短期变坏规则可以表示为决策树的形式。其中,对近期客户行为信息进行分类的步骤可以为:按照预设分类规则,对近期客户行为信息进行分类,分类的结果可以为:将所述近期客户行为信息分类为:近期客户个人信息以及近期客户借贷行为信息,其中,近期客户个人信息可以分类为:近期客户年龄、近期客户性别、近期客户行业以及近期客户信用分,所述近期客户借贷行为信息可以分类为:借贷金额、借贷日、还款日以及历史借贷情况,其中,历史借贷情况可以分类为:历史借贷金额、历史逾期天数、历史逾期率。
本申请实施例通过预设目标短期预测模型,确定近期客户的近期短期变坏规则,进而可以根据近期短期变坏规则预测近期客户的长期变坏风险,使得预设目标短期预测模型可以学习到近期客户的坏客户条件,进而生成近期客户的近期短期变坏规则,使得在预测近期客户的短期变坏概率时,能提高对近期客户的短期预测效果,使得近期客户的短期变坏概率更为准确。
其中,所述将所述近期短期变坏规则迁移到所述源长期风险预测模型,并更新源长期风险预测模型,得到目标长期风险模型的步骤包括:
步骤B10,将所述近期短期变坏规则导入到所述源长期风险预测模型;
步骤B20,将源长期风险预测模型中所述前期客户的短期变坏风险替换为所述近期客户的近期短期变坏规则,得到目标长期风险模型。
在本实施例中,需要说明的是,本申请是通过迁移学习的方法,将近期客户的近期短期变坏规则迁移到所述源长期风险预测模型,也即将源长期风险预测模型中的前期客户的短期变坏风险替换为近期短期变坏规则,通过迁移学习的方法,将近期短期变坏规则迁移到所述源长期风险预测模型得到目标长期风险模型,进而在对近期客户的长期变坏风险进行预测时,可以在目标长期风险模型中输入近期客户的近期行为信息,完成对近期客户的长期变坏风险的预测。可以理解的,将近期短期变坏规则迁移到所述源长期风险预测模型,得到目标长期风险模型中,所述目标长期风险模型是学习了近期客户的近期短期变坏规则的,所以,目标长期风险模型可以提高对近期客户的长期风险概率预测的准确性,另外,还需要说明的是,前期客户或近期客户的短期变坏概率高,但前期客户或近期客户的长期变坏风险不一定高,所以不能只通过短期变坏的概率确定长期变坏风险,本申请不是仅通过近期短期变坏规则就确定近期客户的长期变坏风险,而是通过能预测长期变坏风险的目标长期风险模型对近期客户的长期变坏风险近期预测,使得近期客户的长期变坏风险预测的更为准确,且通过将近期短期变坏规则迁移到所述源长期风险预测模型,得到目标长期风险模型,无需再重新建立新的模型,就可以预测近期客户的长期变坏风险,提高了对近期客户的长期变坏风险的预测。
其中,在所述将源长期风险预测模型中所述前期客户的短期变坏风险替换为所述近期客户的近期短期变坏规则,得到目标长期风险模型的步骤之后,所述风险预测方法还包括:
步骤B101,获取待预测客户的待预测行为信息;
步骤B102,将所述待预测行为信息输入所述目标长期风险模型,基于所述近期短期变坏规则对预测待预测客户的短期变坏概率,得到待预测客户的中间短期预测值;
步骤B103,根据中间短期预测值以及所述待预测行为信息,对近期客户在长表现期下变坏的概率进行预测,得到所述待预测客户的长期变坏风险。
在本实施例中,需要说明的是,所述待预测客户为在预设近期内的客户,所述中间短期预测值为所述近期客户的短期变坏概率,将所述近期客户的近期客户行为信息输入目标长期风险模型后,根据近期短期变坏规则确定近期客户的短期变坏概率,进而可以根据短期变坏概率预测近期客户在长表现期下的变坏概率,得到所述近期客户的长期变坏风险。
作为一种示例,步骤B101至步骤B103包括:获取近期客户的近期客户行为信息,将所述近期客户行为信息输入所述目标长期风险模型,基于所述近期短期变坏规则,预测所述近期客户的短期变坏概率,得到近期客户的中间短期预测值,根据所述中间短期预测值确定近期客户在长表现期下的变坏概率,得到近期客户的长期变坏风险。在所述得到所述近期客户的长变坏概率的步骤之后,所述风险预测方法还包括:根据预设坏客户概率阈值,和近期客户的长期变坏风险,确定所述近期客户是否为坏客户,判断所述近期客户的长期变坏风险是否大于或等于预设坏客户概率阈值,若所述近期客户的长期变坏风险大于或等于预设坏客户概率阈值,则确定所述近期客户为坏客户,若所述近期客户的长期变坏风险小于预设坏客户概率阈值,则确定所述近期客户为好客户;若所述近期客户为好客户,则向所述近期客户提供借贷帮助,若所述近期客户为坏客户,则不向所述近期客户提供借贷帮助。本申请实施例通过目标长期风险模型,实现对预设近期的客户进行了长期变坏风险的预测,提高了预测近期客户长期变坏风险的准确性。从而为企业提供了是否向客户提供借贷帮助提供了决策依据,降低了企业的借贷风险。
本申请还提供另一实施例,为了更好理解本申请,对本申请的实现原理进行说明:
本申请中利用了贝叶斯思路,分析客户的长期变坏原理,其中,客户可以为近期客户也可以为前期客户。分析客户长期变坏的贝叶斯公式为:
P(YL=1|x)=P((YS=1|x)*P(YL=1|x,YS=1)
+P(YS=0|x)*P(YL=1|x,YS=0))
=P((YS=1|x)*P(YL=1|x,YS=1)
+(1-P((YS=1|x))*P(YL=1|x,YS=0)
其中,YL长表现期,YS为短表现期,x为客户,P(YL=1|x)为客户的长期变坏风险,所述长期变坏风险可以为长期变坏概率,P(YS=1|x)为客户的短期变坏风险,所述短期变坏风险可以为短期变坏概率,P(YL=1|x,YS=1)为短期为坏客户的情况下长期变坏的概率,P(YL=1|x,YS=0)为短期为好客户的情况下长期变坏的概率,所以要预测客户的长期变坏风险,只需要预测P(YS=1|x)短期变坏风险、P(YL=1|x,YS=1)短期为坏客户的情况下长期变坏的概率,以及P(YL=1|x,YS=0)为短期为好客户的情况下P(YL=1|x)长期变坏的概率。在风险预测场景中,当关于风控模型的准入策略变化时,其中,所述准入策略可以包括但不限于:年龄准入、地区准入以及行业准入,对短期为好客户的情况下长期变坏的概率,以及短期为坏客户的情况下长期变坏的概率的影响较小,所以预测客户的长期变坏风险P(YL=1|x)可以转化为函数:
P(YL|x)=f(P(YS=1|x))
也即,对函数f和P(YS=1|x)进行预测,首先可以先对源域的客户进行短期变坏概率的预测,也就是预测前期客户的短期变坏概率,再将短期变坏概率输入到预设长表现风险预测模型中,得到源长期风险预测模型,也即f函数f(P(YS=1|x),x),确定目标域的客户的近期短期变坏规则P'(YS=1|x)),也即确定近期客户的近期短期变坏规则,将近期短期变坏规则迁移到源长期风险预测模型中,也即将近期短期变坏规则迁移到f函数中,得到f(P'(YS=1|x),x),也即目标长期风险模型。
实施例四
参照图6,本申请实施例还提供一种风险预测装置,所述风险预测装置包括:
源域模型获取模块10,用于获取源长期风险预测模型,其中,所述源长期风险预测模型由前期客户在第一观察点的短期变坏风险,以及前期客户的前期客户行为信息训练得到;
规则确定模块20,用于确定近期客户在第二观察点的近期短期变坏规则,其中,所述前期客户的开通时间点在所述近期客户的开通时间点之前;
规则迁移模块30,用于将所述近期短期变坏规则迁移到所述源长期风险预测模型,并更新所述源长期风险预测模型,得到目标长期风险模型,其中,所述目标长期风险模型用于对近期客户进行预测以确定近期客户的长期变坏风险。
可选地,所述源域模型获取模块10还包括:
确定所述前期客户在第一观察点的短期变坏风险;
将至少一个所述前期客户的所述短期变坏风险,以及所述前期客户的前期客户行为信息作为源域训练样本集,对预设长表现期预测模型进行训练,得到源长期风险预测模型。
可选地,所述源域模型获取模块10还包括:
获取所述前期客户在第一观察点的前期客户行为信息;
将所述前期客户行为信息输入预设源短期预测模型,预测前期客户在第一观察点的短期变坏的概率,以作为所述前期客户的短期变坏风险。
可选地,所述源域模型获取模块10还包括:
在所述源域训练样本集中获取所述前期客户的所述短期变坏风险以及所述前期客户行为信息;
将所述前期客户的所述短期变坏风险以及所述前期客户行为信息输入所述预设长表现期预测模型,对前期客户的长期变坏概率进行预测,得到长期变坏风险;
计算所述长期变坏风险和预设长期变坏标签之间的训练距离,将所述训练距离与预设距离阈值进行比对;
若所述训练距离小于或者等于所述预设距离阈值,则将所述预设长表现期预测模型作为所述源长期风险预测模型;
若所述训练距离大于所述预设距离阈值,则继续根据所述源域训练样本集对所述预设长表现期预测模型进行训练,直至所述训练距离小于或等于所述预设距离阈值。
可选地,所述规则确定模块20还包括:
获取近期客户在第二观察点的近期客户行为信息;
将所述近期客户行为信息输入预设目标短期预测模型,对近期客户行为信息进行分类,得到近期短期变坏规则。
可选地,所述规则迁移模块30还包括:
将所述近期短期变坏规则导入到所述源长期风险预测模型;
将源长期风险预测模型中所述前期客户的短期变坏风险替换为所述近期客户的近期短期变坏规则,得到目标长期风险模型。
可选地,所述规则迁移模块30还包括:
获取待预测客户的待预测行为信息;
将所述待预测行为信息输入所述目标长期风险模型,基于所述近期短期变坏规则对预测待预测客户的短期变坏概率,得到待预测客户的中间短期预测值;
根据中间短期预测值以及所述待预测行为信息,对近期客户在长表现期下变坏的概率进行预测,得到所述待预测客户的长期变坏风险。
本申请提供的风险预测装置,采用上述实施例中的风险预测方法,旨在解决现有风控模型对近期客户的长期变坏风险的预测效果差的技术问题。与现有技术相比,本申请实施例提供的风险预测方法的有益效果与上述实施例提供的风险预测方法的有益效果相同,且该风险预测装置中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
实施例五
本申请实施例提供一种电子设备,所述电子设备可以为播放设备,电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例中的风险预测方法。
下面参考图7,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(personal digital assistant,个人数字助理)、PAD(portable Android device,平板电脑)、PMP(Portable Media Player,便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备可以包括处理装置1001(例如中央处理器、图形处理器等),其可以根据存储在ROM(Read-Only Memory,只读存储器)1002中的程序或者从存储装置1003加载到RAM(Random Access Memory,随机访问存储器)1004中的程序而执行各种适当的动作和处理。在RAM1004中,还存储有电子设备操作所需的各种程序和数据。处理装置1001、ROM1002以及RAM1004通过总线1005彼此相连。输入/输出(I/O)接口1006也连接至总线。
通常,以下系统可以连接至I/O接口1006:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加转速计、陀螺仪等的输入装置1007;包括例如LCD(Liquid CrystalDisplay,液晶显示器)、扬声器、振动器等的输出装置1008;包括例如磁带、硬盘等的存储装置1003;以及通信装置1009。通信装置可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种系统的电子设备,但是应理解的是,并不要求实施或具备所有示出的系统。可以替代地实施或具备更多或更少的系统。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信系统从网络上被下载和安装,或者从存储系统被安装,或者从ROM被安装。在该计算机程序被处理系统执行时,执行本公开实施例的方法中限定的上述功能。
本申请提供的电子设备,采用上述实施例一中的风险预测方法旨在解决现有风控模型对近期客户的长期变坏风险的预测效果差的技术问题。与现有技术相比,本申请实施例提供的产品流量数据分配的有益效果与上述实施例提供的风险预测方法的有益效果相同,且该风险预测装置中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
实施例六
本实施例提供一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行上述实施例一中的风险预测方法。
本申请实施例提供的计算机可读存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的设备、设备或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程EPROM(Electrical ProgrammableRead Only Memory,只读存储器)或闪存、光纤、便携式紧凑磁盘CD-ROM(compact discread-only memory,只读存储器)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行设备、设备或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(RadioFrequency,射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是电子设备中所包含的;也可以是单独存在,而未装配入电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被电子设备执行时,使得电子设备:获取源长期风险预测模型,其中,所述源长期风险预测模型由前期客户在第一观察点的短期变坏风险,以及前期客户的前期客户行为信息训练得到;确定近期客户在第二观察点的近期短期变坏规则,其中,所述前期客户的开通时间点在所述近期客户的开通时间点之前;将所述近期短期变坏规则迁移到所述源长期风险预测模型,并更新所述源长期风险预测模型,得到目标长期风险模型,其中,所述目标长期风险模型用于对近期客户进行预测以确定近期客户的长期变坏风险。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括LAN(localarea network,局域网)或WAN(Wide Area Network,广域网)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的设备、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的设备来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该单元本身的限定。
本申请提供的计算机可读存储介质,存储有用于执行上述风险预测方法的计算机可读程序指令,旨在解决现有风控模型对近期客户的长期变坏风险的预测效果差的技术问题。与现有技术相比,本申请实施例提供的计算机可读存储介质的有益效果与上述实施例提供的风险预测方法的有益效果相同,在此不做赘述。
实施例七
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的风险预测方法的步骤。
本申请提供的计算机程序产品旨在解决现有风控模型对近期客户的长期变坏风险的预测效果差的技术问题。与现有技术相比,本申请实施例提供的计算机程序产品的有益效果与上述实施例提供的风险预测方法的有益效果相同,在此不做赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。
Claims (10)
1.一种风险预测方法,其特征在于,所述风险预测方法包括:
获取源长期风险预测模型,其中,所述源长期风险预测模型由前期客户在第一观察点的短期变坏风险,以及前期客户的前期客户行为信息训练得到;
确定近期客户在第二观察点的近期短期变坏规则,其中,所述前期客户的开通时间点在所述近期客户的开通时间点之前;
将所述近期短期变坏规则迁移到所述源长期风险预测模型,并更新所述源长期风险预测模型,得到目标长期风险模型,其中,所述目标长期风险模型用于对近期客户进行预测以确定近期客户的长期变坏风险。
2.如权利要求1所述的风险预测方法,其特征在于,所述获取源长期风险预测模型的步骤包括:
确定所述前期客户在第一观察点的短期变坏风险;
将至少一个所述前期客户的所述短期变坏风险,以及所述前期客户的前期客户行为信息作为源域训练样本集,对预设长表现期预测模型进行训练,得到源长期风险预测模型。
3.如权利要求2所述的风险预测方法,其特征在于,所述确定所述前期客户在第一观察点的短期变坏风险的步骤包括:
获取所述前期客户在第一观察点的前期客户行为信息;
将所述前期客户行为信息输入预设源短期预测模型,预测前期客户在第一观察点的短期变坏的概率,以作为所述前期客户的短期变坏风险。
4.如权利要求2所述的风险预测方法,其特征在于,所述将至少一个所述前期客户的所述短期变坏风险,以及所述前期客户的前期客户行为信息作为源域训练样本集,对预设长表现期预测模型进行训练,得到源长期风险预测模型的步骤包括:
在所述源域训练样本集中获取所述前期客户的所述短期变坏风险以及所述前期客户行为信息;
将所述前期客户的所述短期变坏风险以及所述前期客户行为信息输入所述预设长表现期预测模型,对前期客户的长期变坏概率进行预测,得到长期变坏风险;
计算所述长期变坏风险和预设长期变坏标签之间的训练距离,将所述训练距离与预设距离阈值进行比对;
若所述训练距离小于或者等于所述预设距离阈值,则将所述预设长表现期预测模型作为所述源长期风险预测模型;
若所述训练距离大于所述预设距离阈值,则继续根据所述源域训练样本集对所述预设长表现期预测模型进行训练,直至所述训练距离小于或等于所述预设距离阈值。
5.如权利要求1所述的风险预测方法,其特征在于,所述确定近期客户在第二观察点的近期短期变坏规则的步骤包括:
获取近期客户在第二观察点的近期客户行为信息;
将所述近期客户行为信息输入预设目标短期预测模型,对近期客户行为信息进行分类,得到近期短期变坏规则。
6.如权利要求1所述的风险预测方法,其特征在于,所述将所述近期短期变坏规则迁移到所述源长期风险预测模型,并更新源长期风险预测模型,得到目标长期风险模型的步骤包括:
将所述近期短期变坏规则导入到所述源长期风险预测模型;
将源长期风险预测模型中所述前期客户的短期变坏风险替换为所述近期客户的近期短期变坏规则,得到目标长期风险模型。
7.如权利要求6所述的风险预测方法,其特征在于,在所述将源长期风险预测模型中所述前期客户的短期变坏风险替换为所述近期客户的近期短期变坏规则,得到目标长期风险模型的步骤之后,所述风险预测方法还包括:
获取待预测客户的待预测行为信息;
将所述待预测行为信息输入所述目标长期风险模型,基于所述近期短期变坏规则对预测待预测客户的短期变坏概率,得到待预测客户的中间短期预测值;
根据中间短期预测值以及所述待预测行为信息,对近期客户在长表现期下变坏的概率进行预测,得到所述待预测客户的长期变坏风险。
8.一种风险预测装置,其特征在于,所述风险预测装置包括:
源域模型获取模块,用于获取源长期风险预测模型,其中,所述源长期风险预测模型由前期客户在第一观察点的短期变坏风险,以及前期客户的前期客户行为信息训练得到;
规则确定模块,用于确定近期客户在第二观察点的近期短期变坏规则,其中,所述前期客户的开通时间点在所述近期客户的开通时间点之前;
规则迁移模块,用于将所述近期短期变坏规则迁移到所述源长期风险预测模型,并更新所述源长期风险预测模型,得到目标长期风险模型,其中,所述目标长期风险模型用于对近期客户进行预测以确定近期客户的长期变坏风险。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;
以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述风险预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有实现风险预测方法的程序,所述实现风险预测方法的程序被处理器执行以实现如权利要求1至7中任一项所述风险预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310714042.0A CN116645200A (zh) | 2023-06-15 | 2023-06-15 | 风险预测方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310714042.0A CN116645200A (zh) | 2023-06-15 | 2023-06-15 | 风险预测方法、装置、电子设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116645200A true CN116645200A (zh) | 2023-08-25 |
Family
ID=87624721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310714042.0A Pending CN116645200A (zh) | 2023-06-15 | 2023-06-15 | 风险预测方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116645200A (zh) |
-
2023
- 2023-06-15 CN CN202310714042.0A patent/CN116645200A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10846643B2 (en) | Method and system for predicting task completion of a time period based on task completion rates and data trend of prior time periods in view of attributes of tasks using machine learning models | |
CN106548210B (zh) | 基于机器学习模型训练的信贷用户分类方法及装置 | |
US11861464B2 (en) | Graph data structure for using inter-feature dependencies in machine-learning | |
US20230049747A1 (en) | Training machine learning models using teacher annealing | |
CN107615275A (zh) | 估计用于运行数据挖掘服务的计算资源 | |
CN111340616A (zh) | 线上贷款的审批方法、装置、设备及介质 | |
US20180075765A1 (en) | System and method for transmission of market-ready education curricula | |
Pochiraju et al. | Essentials of business analytics: an introduction to the methodology and its applications | |
CN116883154A (zh) | 信贷风险识别方法、装置、电子设备及可读存储介质 | |
CN112561681A (zh) | 确定潜在贷款企业的方法、装置、电子设备及存储介质 | |
CN114972877A (zh) | 一种图像分类模型训练方法、装置及电子设备 | |
US20220156572A1 (en) | Data partitioning with neural network | |
CN116563007A (zh) | 授信信用风险预测方法、电子设备及可读存储介质 | |
US10824777B2 (en) | Employing natural language processing to facilitate geospatial analysis | |
CN116645200A (zh) | 风险预测方法、装置、电子设备及计算机可读存储介质 | |
CN113688202B (zh) | 情感极性分析方法、装置、电子设备以及计算机存储介质 | |
CN116091249A (zh) | 交易风险的评估方法、装置、电子设备和介质 | |
US20220207413A1 (en) | Loss augmentation for predictive modeling | |
CN111767290B (zh) | 用于更新用户画像的方法和装置 | |
US20210201394A1 (en) | Dynamic financial health predictor | |
CN113298353A (zh) | 一种基于用户生存模型的资源调整方法、装置和系统 | |
CN112419025A (zh) | 用户数据处理方法和装置、存储介质、电子设备 | |
US20240144114A1 (en) | Methods and systems for automated identification of optimizable factors in multivariate processes | |
CN115470292B (zh) | 区块链共识方法、装置、电子设备及可读存储介质 | |
CN112015975B (zh) | 基于牛顿冷却定律的面向金融用户的信息推送方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |