CN117057899A - 信用风险评估方法、装置和设备 - Google Patents
信用风险评估方法、装置和设备 Download PDFInfo
- Publication number
- CN117057899A CN117057899A CN202311033816.XA CN202311033816A CN117057899A CN 117057899 A CN117057899 A CN 117057899A CN 202311033816 A CN202311033816 A CN 202311033816A CN 117057899 A CN117057899 A CN 117057899A
- Authority
- CN
- China
- Prior art keywords
- risk
- value
- target client
- data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000012502 risk assessment Methods 0.000 title claims abstract description 50
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000011156 evaluation Methods 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 22
- 238000010606 normalization Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000004140 cleaning Methods 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 27
- 238000012549 training Methods 0.000 description 17
- 238000012795 verification Methods 0.000 description 17
- 238000010801 machine learning Methods 0.000 description 14
- 238000011161 development Methods 0.000 description 11
- 230000015654 memory Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000002790 cross-validation Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开的实施例提供了一种信用风险评估方法,可以应用于计算机技术领域和人工智能技术领域。该方法包括:获取目标客户数据,对目标客户数据进行标准化处理。将标准化的目标客户数据输入预先利用低代码平台生成的第一预测模型。将目标客户数据输入预先训练完成的第二预测模型。根据所述第一风险预测值、所述第二风险预测值、所述第一风险预测值的权重和所述第二风险预测值的权重,计算目标客户的风险值。基于目标客户的风险值评估目标客户的信用风险等级。本公开还提供了一种信用风险评估装置、计算设备、介质和程序产品。
Description
技术领域
本公开涉及计算机技术领域,具体涉及人工智能技术领域,特别是涉及一种信用风险评估方法、装置、设备、介质和程序产品。
背景技术
信用风险是指交易对方不履行到期债务的风险。又称违约风险,是指借款人、证券发行人或交易对方因种种原因,不愿或无力履行合同条件而构成的违约,致使银行遭受损失的可能性。
在银行的实际经营过程中,对于信用风险的评估始终是一个核心问题。目前,信用风险评估方法一般是通过历史数据作为样本数据训练信用风险评估模型,通过训练好的信用风险评估模型评估信用风险。但是这种方法受模型对数据的拟合度的影响。如果模型对数据的拟合度过高,会导致对一些新的、未知的数据的模型预测的结果出现误差,使致模型预测的结果不准确;如果模型对数据的拟合度过低,会导致一些重要的数据特征未被考虑到,也会导致预测结果不准确。
发明内容
鉴于上述问题,本公开提供了一种信用风险评估方法、装置、设备、介质和程序产品。
根据本公开的第一个方面,提供一种信用风险评估方法,所述方法包括:
获取目标客户数据,所述目标客户数据包括目标客户数据基础信息和目标客户交易信息;
对所述目标客户数据进行标准化处理,得到适应基于低代码平台生成的第一预测模型的标准化的目标客户数据;
将所述标准化的目标客户数据输入预先利用低代码平台生成的第一预测模型,输出第一风险预测值;
将所述目标客户数据输入预先训练完成的第二预测模型,输出第二风险预测值;
预设第一风险预测值的权重和第二风险预测值的权重;
根据所述第一风险预测值、所述第二风险预测值、所述第一风险预测值的权重和所述第二风险预测值的权重,计算所述目标客户的风险值;以及
基于所述目标客户的风险值评估目标客户的信用风险等级。
根据本公开实施例,所述对所述目标客户数据进行标准化处理,得到适应基于低代码平台生成的第一预测模型的标准化的目标客户数据,包括:
对所述目标客户数据进行数据清洗,得到清洗后的目标客户数据,其中,所述数据清洗包括:缺失值处理、噪声处理和去重处理;
获取所述第一预测模型的框架数据类型;以及
根据所述第一预测模型的框架数据类型对所述清洗后的目标客户数据进行标准化处理,以使所述清洗后的目标客户数据适应所述第一预测模型的框架。
根据本公开实施例,利用低代码平台生成的第一预测模型,包括:
获取模板信息,其中,所述模板信息包括特征数据和评价指标,所述特征数据是通过对所述目标客户数据进行分析得到的;
根据所述特征数据,利用低代码平台生成对应不同框架的多个第一模型;
分别对多个第一模型进行超参数调优,以生成多个第二模型;
根据所述评价指标对所述多个第二模型进行排序;以及
将排序第一的第二模型确定为第一预测模型。
根据本公开实施例,所述模板信息还包括超参数数量和超参数取值范围,分别对多个第一模型进行超参数调优,以生成多个第二模型,包括:
分别获取多个第一模型的超参数数量和超参数取值范围;
通过网格搜索的方法分别对多个第一模型的超参数进行调优;以及
生成优化后的多个第二模型。
根据本公开实施例,所述根据所述第一风险预测值、所述第二风险预测值、所述第一风险预测值的权重和所述第二风险预测值的权重,计算所述目标客户的风险值,包括:
将所述第一风险预测值与所述第一风险预测值的权重做乘积运算,得到所述第一风险预测关联值;
将所述第二风险预测值与所述第二风险预测值的权重做乘积运算,得到所述第二风险预测关联值;以及
对所述第一风险预测关联值与所述第二风险预测关联值做求和运算,得到所述目标客户的风险值。
根据本公开实施例,所述基于所述目标客户的风险值评估目标客户的信用风险等级,包括:
将所述目标客户的信用风险等级分为多个等级;
预设每个风险等级的风险值阈值;以及
如果所述目标客户的风险值落入某一风险值阈值,则所述目标客户的信用风险等级就确定为该风险值阈值相对应的风险等级。
根据本公开的第二方面提,供了一种信用风险评估装置,该装置包括:
第一获取模块,用于获取目标客户数据,所述目标客户数据包括目标客户数据基础信息和目标客户交易信息;
第一标准化模块,用于对所述目标客户数据进行标准化处理,得到适应基于低代码平台生成的第一预测模型的标准化的目标客户数据;
第一输入模块,用于将所述标准化的目标客户数据输入预先利用低代码平台生成的第一预测模型,输出第一风险预测值;
第二输入模块,用于将所述目标客户数据输入预先训练完成的第二预测模型,输出第二风险预测值;
第一预设模块,用于预设第一风险预测值的权重和第二风险预测值的权重;
第一计算模块,用于根据所述第一风险预测值、所述第二风险预测值、所述第一风险预测值的权重和所述第二风险预测值的权重,计算所述目标客户的风险值;
评估模块,用于基于所述目标客户的风险值评估目标客户的信用风险等级。
根据本公开的第三方面提,供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行上述信用风险评估方法。
根据本公开的第四方面提,一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述信用风险评估方法。
根据本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述信用风险评估方法。
由于双模型的设置,克服了单一模型对数据的拟合度的影响,提高了预测结果的准确性,减少了模型训练时,对模型对数据的拟合度的需求。并且由于低代码平台可以对第一预测模型框架的筛选和模型参数的优化,减少了模型框架选择不当或模型参数设置不当造成的模型预测准确率降低的状况,进一步提高了预测结果的准确性。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的信用风险评估方法和装置的应用场景图;
图2示意性示出了根据本公开实施例的信用风险评估方法的流程图;
图3示意性示出了根据本公开实施例的信用风险评估方法中数据标准化的流程图;
图4示意性示出了根据本公开实施例的信用风险评估方法中生成第一预测模型的流程图;
图5示意性示出了根据本公开实施例的信用风险评估方法中超参数调优的流程图;
图6示意性示出了根据本公开实施例的信用风险评估方法中低代码平台运行的示意图;
图7示意性示出了根据本公开实施例的信用风险评估方法中计算目标客户风险值的流程图;
图8示意性示出了根据本公开实施例的信用风险评估方法中确定目标客户风险等级的流程图;
图9示意性示出了根据本公开实施例的一种信用风险评估装置的结构框图;
图10示意性示出了根据本公开实施例的一种信用风险评估装置中第一标准化模块的结构框图;
图11示意性示出了根据本公开实施例的一种信用风险评估装置中第一输入模块的结构框图;
图12示意性示出了根据本公开实施例的一种信用风险评估装置中第一调优模块的结构框图;
图13示意性示出了根据本公开实施例的一种信用风险评估装置中第一计算模块的结构框图;
图14示意性示出了根据本公开实施例的一种信用风险评估装置中评估模块的结构框图;
图15示意性示出了根据本公开实施例的适于实现信用风险评估方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程控制装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
首先,对本文中出现的技术术语作如下解释:
低代码开发:是指无需编码或通过少量代码就可以快速生成应用程序,它允许终端用户使用易于理解的可视化工具开发自己的应用程序,即可以降低企业应用开发的成本,提升开发效率。低代码开发平台是无需代码或通过少量代码就可以快速生成应用程序的开发平台。可通过可视化组件进行应用程序的开发。可通过拖拽组件,使具有不同经验水平的开发人员能创建应用程序。
TensorFlow:是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从流图的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。TensorFlow可被用于语音识别或图像识别等多项机器学习和深度学习领域,对2011年开发的深度学习基础架构DistBelief进行了各方面的改进,它可在小到一部智能手机,大到数千台数据中心服务器的各种设备上运行。TensorFlow完全开源,任何人都可以用。
Pytorch:Pytorch是基于Python的科学计算包。Pytorch的前身是Torch,其底层和Torch框架一样,但是使用Python重新写了很多内容,不仅更加灵活,支持动态图,而且提供了Python接口,是一个以Python优先的深度学习框架,不仅能够实现强大的GPU加速,同时还支持动态神经网络。
Sklearn:(scikit-learn)是一个机器学习的Python开源库,提供了各种机器学习算法和工具,包括分类、回归、聚类、降维等等。Sklearn集成了众多机器学习算法和预处理方法,可以方便地进行数据预处理、特征提取、模型训练、模型评估等操作。同时,sklearn还提供了一些可视化工具,帮助用户更好地理解数据和模型。
Mahout:是Apache Software Foundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包含聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用ApacheHadoop库,Mahout可以有效地扩展到云中。
Spark ML:用来构建机器学习工作流。Spark是一种安全的、经正式定义的编程语言,被设计用来支持一些安全或商业集成为关键因素的应用软件设计。其中的ML组件是ML的标准API使用管道的方式,可以将多个算法或者数据处理过程整合到一个管道或者一个流程里运行。
超参数:在机器学习的上下文中,超参数是在开始学习过程之前设置的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果。
超参数调优:也称超参数优化,需要搜索超参数的最佳配置以实现最佳性能。机器学习算法需要用户定义的输入来实现准确性和通用性之间的平衡,这个过程称为超参数调整。
交叉验证:在给定的建模样本中,拿出大部分样本进行建模,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方和。这个过程一直进行,直到所有的样本都被预报了一次而且仅被预报一次。
本公开的实施例提供了一种信用风险评估方法,该方法包括:获取目标客户数据,所述目标客户数据包括目标客户数据基础信息和目标客户交易信息。对所述目标客户数据进行标准化处理,得到适应基于低代码平台生成的第一预测模型的标准化的目标客户数据。将所述标准化的目标客户数据输入预先利用低代码平台生成的第一预测模型,输出第一风险预测值。将所述目标客户数据输入预先训练完成的第二预测模型,输出第二风险预测值。预设第一风险预测值的权重和第二风险预测值的权重。根据所述第一风险预测值、所述第二风险预测值、所述第一风险预测值的权重和所述第二风险预测值的权重,计算所述目标客户的风险值。基于所述目标客户的风险值评估目标客户的信用风险等级。
该方法通过低代码平台生成的第一预测模型输出第一风险预测值和历史数据预先训练的模型输出的第二风险预测值为基础,然后预设权重计算标客户的风险值评估客户风险等级。通过双模型预测提高了预测的精确性,再通过权重的预设,确定了预测结果的侧重点,使预测结果更适用于实际需求。而且由于双模型的设置提高了预测结果的准确性,减少了模型对样本数据拟合度的影响,由于是双模型设置,也可以减少了模型训练时,对样本数据的数量和质量的要求,节约了计算机资源。
图1示意性示出了根据本公开实施例的信用风险评估方法和装置的应用场景图。需要注意的是,图1所示仅为可以应用本公开实施例的场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的应用场景100可以包括多个应用终端和应用服务器。例如,多个应用终端包括应用终端101、应用终端102、应用终端103等等。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用应用终端设备101、102、103通过网络104与应用服务器105交互,以接收或发送消息等。应用终端设备101、102、103上可以安装有各种应用程序,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的信用风险评估方法一般可以由服务器105执行。相应地,本公开实施例所提供的信用风险评估装置一般可以设置于服务器105中。本公开实施例所提供的信用风险评估方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的信用风险评估装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下将基于图1描述的场景,通过图2~图8对公开实施例的信用风险评估方法进行详细描述。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
图2示意性示出了根据本公开实施例的信用风险评估方法的流程图。
如图2所示,该方法200包括步骤S201~S207。
步骤S201,获取目标客户数据,所述目标客户数据包括目标客户数据基础信息和目标客户交易信息。
步骤S202,对所述目标客户数据进行标准化处理,得到适应基于低代码平台生成的第一预测模型的标准化的目标客户数据。
图3示意性示出了根据本公开实施例的信用风险评估方法中数据标准化的流程图。
如图3所示,该方法300包括步骤S301~S303。
步骤S301,对所述目标客户数据进行数据清洗,得到清洗后的目标客户数据,其中,所述数据清洗包括:缺失值处理、噪声处理和去重处理。
步骤S302,获取所述第一预测模型的框架数据类型。
步骤S303,根据所述第一预测模型的框架数据类型对所述清洗后的目标客户数据进行标准化处理,以使所述清洗后的目标客户数据适应所述第一预测模型的框架。
通过数据清洗,可以过滤掉无用数据,节约计算机资源。并且对数据标准化使输入更适用于第一预测模型,提高预测准确性。
返回参照图2,在步骤S203中,将所述标准化的目标客户数据输入预先利用低代码平台生成的第一预测模型,输出第一风险预测值。
图4示意性示出了根据本公开实施例的信用风险评估方法中生成第一预测模型的流程图。
如图4所示,该方法400包括步骤S401~S405。
步骤S401,获取模板信息。
其中,所述模板信息包括特征数据和评价指标,所述特征数据是通过对所述目标客户数据进行分析得到的。
步骤S402,根据所述特征数据,利用低代码平台生成对应不同框架的多个第一模型。
通过低代码平台,可以在无需编码的前提下实现企业系统的常见功能,并通过少量编码扩展系统的功能。与传统的软件开发工具和技术相比,低代码平台的技术门槛更低,对于开发人员的综合能力要求显著降低,同时较少了计算机计算量,显著提高开发效率更高。相比于其他的快速开发工具,低代码平台具有更好的扩展性,更加适用于银行核心业务系统的开发需求。
特征数据是建立模型的基本数据,包括选定特征和标签等数据。具体的框架一般包括:TensorFlow、Pytorch、Sklearn、Mahout和Spark ML等。低代码平台根据模板中的特征数据,自动生成对应的不同框架的模型和调优任务。例如,根据选定特征和标签等数据分别形成具有多个不用超参数取值范围的TensorFlow框架模型、具有多个不用超参数取值范围的Pytorch框架模型、具有多个不用超参数取值范围的Sklearn框架模型、具有多个不用超参数取值范围的Mahout框架模型和具有多个不用超参数取值范围的Spark ML框架模型等。
步骤S403,分别对多个第一模型进行超参数调优,以生成多个第二模型。
图5示意性示出了根据本公开实施例的信用风险评估方法中超参数调优的流程图。
如图5所示,该流程500包括步骤S501~S503。
步骤S501,分别获取多个第一模型的超参数数量和超参数取值范围。
例如,分别获取TensorFlow框架模型的超参数数量和超参数取值范围;Pytorch框架模型的超参数数量和超参数取值范围;Sklearn框架模型的超参数数量和超参数取值范围;Mahout框架模型的超参数数量和超参数取值范围和Spark ML框架模型的超参数数量和超参数取值范围等。
步骤S502,通过网格搜索的方法分别对多个第一模型的超参数进行调优。
例如,可以分别对多个超参数的取值范围内的超参数值进行随机排列组合,生成模型超参数容器。
以TensorFlow框架模型为例,分别获取TensorFlow框架模型每一个超参数取值范围,对每个超参数的取值范围内的超参数值进行随机排列组合,生成模型超参数容器。
例如,假设某个TensorFlow框架模型具有超参数数量为3个,他们的范围分别是超参数1为[1,2,3]、超参数1为[a,b,c]、超参数1为[x,y,z]。超参数1可以取3个值(即1、2、3);超参数2可以取3个值(即a、b、c);超参数3可以取3个值(即x、y、z)。对超参数1、超参数2、超参数3的值进行随机排列组合,也就是可以形成27个不相同组合,将这27个不相同组合生成模型超参数容器。
在所述模型超参数容器内多次不放回地随机抽样选取超参数组合。
例如,对上述示例中的模型超参数容器中的27种不相同组合进行随机不放回选取,得到27种不相同的超参数组合。
用交叉验证的策略对每个超参数组合进行评估。
可以将所有超参数组合分成n份。
例如,将上述示例的27种超参数组合分成9份,每份有3种超参数组合。
不重复地每次获取其中1份超参数组合做验证集,其他n-1份超参数组合做训练集来进行模型训练,之后计算该模型验证集的均方误差。
例如,根据上述示例,先获取第1份超参数组合做验证集,其他8份超参数组合做训练集来进行模型训练,然后计算验证集的3种超参数组合的预报误差,记录它们的平方和作为第一验证集的均方误差。
再获取第2份超参数组合做验证集,其他8份超参数组合做训练集来进行模型训练,然后计算验证集的3种超参数组合的预报误差,记录它们的平方和作为第二验证集的均方误差。
最后,获取第9份超参数组合做验证集,其他8份超参数组合做训练集来进行模型训练,然后计算验证集的3种超参数组合的预报误差,记录它们的平方和作为第九验证集的均方误差。
直到无验证集可选时,计算所有均方误差的平均值。
例如,在上述示例中,在获取第9份超参数组合做验证集后已无验证集可选。计算第一验证集的均方误差、第二验证集的均方误差、第三验证集的均方误差、……、第九验证集的均方误差的平均值,作为超参数组合的评估标准对其进行评估。
通过交叉验证策略可以评估模型在新数据集上的预测效果,使得到的超参数组合更优。
获取最优超参数组合的模型作为所述第二模型。通过网格搜索的方法调优,避免了重复采样,节约了内存资源。
步骤S503,生成优化后的多个第二模型。
例如,生成了TensorFlow框架的最优超参数模型、Pytorch框架的最优超参数模型、Sklearn框架的最优超参数模型、Mahout框架的最优超参数模型、Spark ML框架的最优超参数模型等。
通过对模型超参数进行调优,可以使模型更符合实际需求。
返回参照图4,在步骤S404中,根据所述评价指标对所述多个第二模型进行排序。
可以先获取每个第二模型的准确率、精确率和召回率。再根据所述准确率、所述精确率和所述召回率,计算每个第二模型的评价指标得分。
准确率是预测正确的结果占总样本的百分比,代表整体的预测准确程度,既包括正样本也包括负样本。精确率是所有被预测为正的样本中实际为正的样本的概率,代表正样本结果中预测的准确度。召回率是预测为正的样本占实际为正的样本的占比。
计算每个第二模型的评价指标得分可以先预设模型的准确率权重、精确率权重和召回率权重;计算准确率和准确率权重的乘积作为第一相关值。计算精确率和精确率权重的乘积作为第二相关值。计算召回率和召回率权重的乘积作为第三相关值。对第一相关值、第二相关值和第三相关值求和,作为评价指标得分。
例如,预设模型的准确率用u表示,预设模型的准确率权重用wu表示;预设模型的精确率用p表示,预设模型的精确率权重用wp表示;预设模型的召回率用q表示,预设模型的精确率权重用wq表示。第一相关值表示为u*wu;第二相关值表示为p*wp;第二相关值表示为q*wq;评价指标得分表示为s。
根据公式:c=u*wu+p*wp+q*wq计算评价指标得分。
通过对准确率、精确率和召回率预设权重,可以使得出的模型排序更符合实际需求。
根据所述评价指标得分对所述第二模型进行排序。例如,根据评价指标得分对TensorFlow框架的最优超参数模型、Pytorch框架的最优超参数模型、Sklearn框架的最优超参数模型、Mahout框架的最优超参数模型、Spark ML框架的最优超参数模型等不同的模型进行排序。通过准确率、精确率和召回率对模型进行排序,可以更准确地得出模型排序。
步骤S405,将排序第一的第二模型确定为第一预测模型。
通过低代码平台生成不同框架的多个具有超参数范围的模型,在通过超参数调优生成最优超参数的不同框架模型,对多个第二模型进行排序,得到目标模型,使目标模型和模板信息更加匹配,更符合使用需求。并且,利用低代码平台无需代码或少量代码的特性,节约了计算机资源,节省了模型生成时间,提高了计算机效率。
图6示意性示出了根据本公开实施例的信用风险评估方法中低代码平台运行的示意图。
如图6所示,在低代码开发平台600中,用户通用自定义模板模块配置好模板信息。低代码平台通过模板转换模块,将模板转换为对应机器学习框架的任务执行计划发送给任务调度模块。任务调度模块将生成的任务发送给任务执行模块,通过任务执行模块生成多种框架的机器学习模型,并进行模型优化和计算模型指标。通过模型归档模块保存训练好的模型,根据评价指标,依次排序并选出目标模型。最后的模型推理模块用于模型的扩展和应用。
通过上述方法,避免建模流程中使用人力进行重复的建模步骤,减少模型的开发时间没节约了计算机资源。而且避免机器学习框架众多,不同框架间支持的机器学习算法也各有不同,开发人员需要同时掌握多种机器学习框架,使其工作效率低下。同时利用低代码平台屏蔽了不同机器学习模型框架的使用细节,降低了训练机器学习模型的难度。同时配置化的低代码平台使得训练模型和模型调优过程自动化,节约了人力投入,提高了工作效率。
返回参照图2,在步骤S204中,将所述目标客户数据输入预先训练完成的第二预测模型,输出第二风险预测值。
预先训练第二预测模型包括:将历史客户数据分为训练集和测试集,对训练集的数据进行训练,得到预测模型,再获取测试集数据对得到的预测模型进行验证,如果验证通过,则确定验证通过的预测模型为第二预测模型。
步骤S205,预设第一风险预测值的权重和第二风险预测值的权重。
步骤S206,根据所述第一风险预测值、所述第二风险预测值、所述第一风险预测值的权重和所述第二风险预测值的权重,计算所述目标客户的风险值。
图7示意性示出了根据本公开实施例的信用风险评估方法中计算目标客户风险值的流程图。
如图7所示,该流程700包括步骤S701~S703。
步骤S701,将所述第一风险预测值与所述第一风险预测值的权重做乘积运算,得到所述第一风险预测关联值。
步骤S702,将所述第二风险预测值与所述第二风险预测值的权重做乘积运算,得到所述第二风险预测关联值。
步骤S703,对所述第一风险预测关联值与所述第二风险预测关联值做求和运算,得到所述目标客户的风险值。
通过权重计算使预测结果更适用于实际需求。
返回参照图2,在步骤S207中,基于所述目标客户的风险值评估目标客户的信用风险等级。
如图8所示,该流程800包括步骤S801~S803。
步骤S801,将所述目标客户的信用风险等级分为多个等级。
步骤S802,预设每个风险等级的风险值阈值。
步骤S803,如果所述目标客户的风险值落入某一风险值阈值,则所述目标客户的信用风险等级就确定为该风险值阈值相对应的风险等级。
通过风险等级的设定,使目标客户的信用风险等级更加清晰明确,方便识别。
图9示意性示出了根据本公开实施例的一种信用风险评估装置的结构框图。
如图9所示,信用风险评估装置900包括:第一获取模块901、第一标准化模块902、第一输入模块903、第二输入模块904、第一预设模块905、第一计算模块906和评估模块907。
第一获取模块901,用于获取目标客户数据,所述目标客户数据包括目标客户数据基础信息和目标客户交易信息。在一实施例中,第一获取模块901可以用于执行前文描述的步骤S201,在此不再赘述。
第一标准化模块902,用于对所述目标客户数据进行标准化处理,得到适应基于低代码平台生成的第一预测模型的标准化的目标客户数据。在一实施例中,第一标准化模块902可以用于执行前文描述的步骤S202。
图10示意性示出了根据本公开实施例的一种信用风险评估装置中第一标准化模块的结构框图。
如图10所示,第一标准化模块902包括:数据清洗模块1001、第四获取模块1002和第二标准化模块1003。
数据清洗模块1001,用于对所述目标客户数据进行数据清洗,得到清洗后的目标客户数据,其中,所述数据清洗包括:缺失值处理、噪声处理和去重处理。在一实施例中,数据清洗模块1001可以用于执行前文描述的步骤S301,在此不再赘述。
第四获取模块1002,用于获取所述第一预测模型的框架数据类型。在一实施例中,第四获取模块1002可以用于执行前文描述的步骤S302,在此不再赘述。
第二标准化模块1003,用于根据所述第一预测模型的框架数据类型对所述清洗后的目标客户数据进行标准化处理,以使所述清洗后的目标客户数据适应所述第一预测模型的框架。在一实施例中,第二标准化模块1003可以用于执行前文描述的步骤S303,在此不再赘述。
返回参照图9,第一输入模块903,用于将所述标准化的目标客户数据输入预先利用低代码平台生成的第一预测模型,输出第一风险预测值。在一实施例中,第一输入模块903可以用于执行前文描述的步骤S203。
图11示意性示出了根据本公开实施例的一种信用风险评估装置中第一输入模块的结构框图。
如图1 1所示,第一输入模块903包括:第二获取模块1101、第一生成模块1102、第一调优模块1103、排序模块1104和第一确定模块1105。
第二获取模块1101,用于获取模板信息,其中,所述模板信息包括特征数据和评价指标,所述特征数据是通过对所述目标客户数据进行分析得到的。在一实施例中,第二获取模块1101可以用于执行前文描述的步骤S401,在此不再赘述。
第一生成模块1102,用于根据所述特征数据,利用低代码平台生成对应不同框架的多个第一模型。在一实施例中,第一生成模块1102可以用于执行前文描述的步骤S402,在此不再赘述。
第一调优模块1103,用于分别对多个第一模型进行超参数调优,以生成多个第二模型。在一实施例中,第一调优模块1103可以用于执行前文描述的步骤S403。
图12示意性示出了根据本公开实施例的一种信用风险评估装置中第一调优模块的结构框图。
如图12所示,第一调优模块1103包括:第三获取模块1201、第二调优模块1202和第二生成模块1203。
第三获取模块1201,用于分别获取多个第一模型的超参数数量和超参数取值范围。在一实施例中,第三获取模块1201可以用于执行前文描述的步骤S501,在此不再赘述。
第二调优模块1202,用于通过网格搜索的方法分别对多个第一模型的超参数进行调优。在一实施例中,第二调优模块1202可以用于执行前文描述的步骤S502,在此不再赘述。
第二生成模块1203,用于生成优化后的多个第二模型。在一实施例中,第二生成模块1203可以用于执行前文描述的步骤S503,在此不再赘述。
返回参照图11,排序模块1104,用于根据所述评价指标对所述多个第二模型进行排序。在一实施例中,排序模块1104可以用于执行前文描述的步骤S404,在此不再赘述。
第一确定模块11 05,用于将排序第一的第二模型确定为第一预测模型。在一实施例中,第一确定模块1105可以用于执行前文描述的步骤S405,在此不再赘述。
返回参照图9,第二输入模块904,用于将所述目标客户数据输入预先训练完成的第二预测模型,输出第二风险预测值。在一实施例中,第二输入模块904可以用于执行前文描述的步骤S204,在此不再赘述。
第一预设模块905,用于预设第一风险预测值的权重和第二风险预测值的权重。在一实施例中,第一预设模块905可以用于执行前文描述的步骤S205,在此不再赘述。
第一计算模块906,用于根据所述第一风险预测值、所述第二风险预测值、所述第一风险预测值的权重和所述第二风险预测值的权重,计算所述目标客户的风险值。在一实施例中,第一计算模块906可以用于执行前文描述的步骤S206。
图13示意性示出了根据本公开实施例的一种信用风险评估装置中第一计算模块的结构框图。
如图13所示,第一计算模块906包括:第二计算模块1301、第三计算模块1302和第四计算模块1303。
第二计算模块1301,用于将所述第一风险预测值与所述第一风险预测值的权重做乘积运算,得到所述第一风险预测关联值。在一实施例中,第二计算模块1301可以用于执行前文描述的步骤S701,在此不再赘述。
第三计算模块1302,用于将所述第二风险预测值与所述第二风险预测值的权重做乘积运算,得到所述第二风险预测关联值。在一实施例中,第三计算模块1302可以用于执行前文描述的步骤S702,在此不再赘述。
第四计算模块1303,用于对所述第一风险预测关联值与所述第二风险预测关联值做求和运算,得到所述目标客户的风险值。在一实施例中,第四计算模块1303可以用于执行前文描述的步骤S703,在此不再赘述。
返回参照图9,评估模块907,用于基于所述目标客户的风险值评估目标客户的信用风险等级。在一实施例中,评估模块907可以用于执行前文描述的步骤S207。
图14示意性示出了根据本公开实施例的一种信用风险评估装置中评估模块的结构框图。
如图14所示,评估模块907包括:分级模块1401、第二预设模块1402和第二确定模块1403。
分级模块1401,用于将所述目标客户的信用风险等级分为多个等级。在一实施例中,分级模块1401可以用于执行前文描述的步骤S801,在此不再赘述。
第二预设模块1402,用于预设每个风险等级的风险值阈值。在一实施例中,第二预设模块1402可以用于执行前文描述的步骤S802,在此不再赘述。
第二确定模块1403,用于如果所述目标客户的风险值落入某一风险值阈值,则所述目标客户的信用风险等级就确定为该风险值阈值相对应的风险等级。在一实施例中,第二确定模块1403可以用于执行前文描述的步骤S803,在此不再赘述。
根据本公开的实施例,第一获取模块901、第一标准化模块902、第一输入模块903、第二输入模块904、第一预设模块905、第一计算模块906和评估模块907中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一获取模块901、第一标准化模块902、第一输入模块903、第二输入模块904、第一预设模块905、第一计算模块906和评估模块907中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获取模块901、第一标准化模块902、第一输入模块903、第二输入模块904、第一预设模块905、第一计算模块906和评估模块907中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图15示意性示出了根据本公开实施例的适于实现基于区块链的程序交付方法的电子设备的方框图。
如图15所示,根据本公开实施例的电子设备1500包括处理器1501,其可以根据存储在只读存储器(ROM)1502中的程序或者从存储部分1508加载到随机访问存储器(RAM)1503中的程序而执行各种适当的动作和处理。处理器1501例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器1501还可以包括用于缓存用途的板载存储器。处理器1501可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1503中,存储有电子设备1500操作所需的各种程序和数据。处理器1501、ROM 1502以及RAM1503通过总线1504彼此相连。处理器1501通过执行ROM1502和/或RAM1503中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 1502和RAM 1503以外的一个或多个存储器中。处理器1501也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备1500还可以包括输入/输出(I/O)接口1505,输入/输出(I/O)接口1505也连接至总线1504。电子设备1500还可以包括连接至I/O接口1505的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1507;包括硬盘等的存储部分1508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1509。通信部分1509经由诸如因特网的网络执行通信处理。驱动器1510也根据需要连接至I/O接口1505。可拆卸介质1511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1510上,以便于从其上读出的计算机程序根据需要被安装入存储部分1508。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM1502和/或RAM 1503和/或ROM1502和RAM1503以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的基于区块链的程序交付方法。
在该计算机程序被处理器1501执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分1509被下载和安装,和/或从可拆卸介质1511被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分1509从网络上被下载和安装,和/或从可拆卸介质1511被安装。在该计算机程序被处理器1501执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (10)
1.一种信用风险评估方法,其特征在于,该方法包括:
获取目标客户数据,所述目标客户数据包括目标客户数据基础信息和目标客户交易信息;
对所述目标客户数据进行标准化处理,得到适应基于低代码平台生成的第一预测模型的标准化的目标客户数据;
将所述标准化的目标客户数据输入预先利用低代码平台生成的第一预测模型,输出第一风险预测值;
将所述目标客户数据输入预先训练完成的第二预测模型,输出第二风险预测值;
预设第一风险预测值的权重和第二风险预测值的权重;
根据所述第一风险预测值、所述第二风险预测值、所述第一风险预测值的权重和所述第二风险预测值的权重,计算所述目标客户的风险值;以及
基于所述目标客户的风险值评估目标客户的信用风险等级。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标客户数据进行标准化处理,得到适应基于低代码平台生成的第一预测模型的标准化的目标客户数据,包括:
对所述目标客户数据进行数据清洗,得到清洗后的目标客户数据,其中,所述数据清洗包括:缺失值处理、噪声处理和去重处理;
获取所述第一预测模型的框架数据类型;以及
根据所述第一预测模型的框架数据类型对所述清洗后的目标客户数据进行标准化处理,以使所述清洗后的目标客户数据适应所述第一预测模型的框架。
3.根据权利要求1所述的方法,其特征在于,利用低代码平台生成的第一预测模型,包括:
获取模板信息,其中,所述模板信息包括特征数据和评价指标,所述特征数据是通过对所述目标客户数据进行分析得到的;
根据所述特征数据,利用低代码平台生成对应不同框架的多个第一模型;
分别对多个第一模型进行超参数调优,以生成多个第二模型;
根据所述评价指标对所述多个第二模型进行排序;以及
将排序第一的第二模型确定为第一预测模型。
4.根据权利要求3所述的方法,其特征在于,所述模板信息还包括超参数数量和超参数取值范围,分别对多个第一模型进行超参数调优,以生成多个第二模型,包括:
分别获取多个第一模型的超参数数量和超参数取值范围;
通过网格搜索的方法分别对多个第一模型的超参数进行调优;以及
生成优化后的多个第二模型。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一风险预测值、所述第二风险预测值、所述第一风险预测值的权重和所述第二风险预测值的权重,计算所述目标客户的风险值,包括:
将所述第一风险预测值与所述第一风险预测值的权重做乘积运算,得到所述第一风险预测关联值;
将所述第二风险预测值与所述第二风险预测值的权重做乘积运算,得到所述第二风险预测关联值;以及
对所述第一风险预测关联值与所述第二风险预测关联值做求和运算,得到所述目标客户的风险值。
6.根据权利要求1~5中任意一项所述的方法,其特征在于,所述基于所述目标客户的风险值评估目标客户的信用风险等级,包括:
将所述目标客户的信用风险等级分为多个等级;
预设每个风险等级的风险值阈值;以及
如果所述目标客户的风险值落入某一风险值阈值,则所述目标客户的信用风险等级就确定为该风险值阈值相对应的风险等级。
7.一种信用风险评估装置,其特征在于,该装置包括:
第一获取模块,用于获取目标客户数据,所述目标客户数据包括目标客户数据基础信息和目标客户交易信息;
第一标准化模块,用于对所述目标客户数据进行标准化处理,得到适应基于低代码平台生成的第一预测模型的标准化的目标客户数据;
第一输入模块,用于将所述标准化的目标客户数据输入预先利用低代码平台生成的第一预测模型,输出第一风险预测值;
第二输入模块,用于将所述目标客户数据输入预先训练完成的第二预测模型,输出第二风险预测值;
第一预设模块,用于预设第一风险预测值的权重和第二风险预测值的权重;
第一计算模块,用于根据所述第一风险预测值、所述第二风险预测值、所述第一风险预测值的权重和所述第二风险预测值的权重,计算所述目标客户的风险值;以及
评估模块,用于基于所述目标客户的风险值评估目标客户的信用风险等级。
8.一种电子设备,包括:
一个或处理器;
存储装置,用于存储一个或程序,
其中,当所述一个或程序被所述一个或处理器执行时,使得所述一个或处理器执行如权利要求1~6中任意一项所述的方法。
9.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如权利要求1~6中任意一项所述的方法。
10.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311033816.XA CN117057899A (zh) | 2023-08-16 | 2023-08-16 | 信用风险评估方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311033816.XA CN117057899A (zh) | 2023-08-16 | 2023-08-16 | 信用风险评估方法、装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117057899A true CN117057899A (zh) | 2023-11-14 |
Family
ID=88653069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311033816.XA Pending CN117057899A (zh) | 2023-08-16 | 2023-08-16 | 信用风险评估方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117057899A (zh) |
-
2023
- 2023-08-16 CN CN202311033816.XA patent/CN117057899A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10360517B2 (en) | Distributed hyperparameter tuning system for machine learning | |
US10387536B2 (en) | Computerized data-aware agent systems for retrieving data to serve a dialog between human user and computerized system | |
AU2020385264B2 (en) | Fusing multimodal data using recurrent neural networks | |
US11107166B2 (en) | Multi-step day sales outstanding forecasting | |
CN110705719A (zh) | 执行自动机器学习的方法和装置 | |
CN114638695A (zh) | 信用评估方法、装置、设备及介质 | |
US20210049414A1 (en) | Deep graph de-noise by differentiable ranking | |
CA3135466A1 (en) | User loan willingness prediction method and device and computer system | |
CN113159934A (zh) | 一种网点客流量的预测方法、系统、电子设备及存储介质 | |
CN111210332A (zh) | 贷后管理策略生成方法、装置及电子设备 | |
CN111695988A (zh) | 信息处理方法、装置、电子设备和介质 | |
CN116957644A (zh) | 交叉营销预测方法、装置、电子设备及介质 | |
CN110910241A (zh) | 现金流评估方法、装置、服务器设备及存储介质 | |
CN112446777A (zh) | 一种信用评估方法、装置、设备及存储介质 | |
US20230316301A1 (en) | System and method for proactive customer support | |
CN115795345A (zh) | 信息处理方法、装置、设备及存储介质 | |
KR102284440B1 (ko) | 딥러닝 모델 거래중개서버에 의해서 수행되는 딥러닝 모델 거래를 중개하는 방법 | |
CN117057899A (zh) | 信用风险评估方法、装置和设备 | |
CN114358024A (zh) | 日志分析方法、装置、设备、介质和程序产品 | |
US20230229735A1 (en) | Training and implementing machine-learning models utilizing model container workflows | |
CN117172632B (zh) | 一种企业异常行为检测方法、装置、设备及存储介质 | |
CN115037655B (zh) | 压测方法和系统 | |
CN114065050A (zh) | 产品推荐的方法、系统、电子设备和存储介质 | |
CN116450950A (zh) | 产品组合推荐方法、装置、设备及介质 | |
CN117934154A (zh) | 交易风险预测方法、模型训练方法、装置、设备、介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |