CN114004691A - 基于融合算法的额度评分方法、装置、设备及存储介质 - Google Patents
基于融合算法的额度评分方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114004691A CN114004691A CN202111297149.7A CN202111297149A CN114004691A CN 114004691 A CN114004691 A CN 114004691A CN 202111297149 A CN202111297149 A CN 202111297149A CN 114004691 A CN114004691 A CN 114004691A
- Authority
- CN
- China
- Prior art keywords
- data
- preset
- screening
- model
- influence factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Fuzzy Systems (AREA)
- Technology Law (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明属于大数据技术领域,公开了一种基于融合算法的额度评分方法、装置、设备及存储介质。该方法包括:根据预设基础额度特征池对用户数据进行筛选得到第一入模数据;将第一入模数据带入基础额度模型得到用户基础授信额度;根据预设影响因子特征对用户数据进行筛选得到第二入模数据;将第二入模数据带入影响因子模型得到影响参数;根据用户基础授信额度和所述影响参数得到最终授信额度评分。通过上述方式实现了对入模数据的自动化筛选,通过对用户数据进行筛选选择从中选择部分用户数据作为入模特征得到影响参数和基础授信额度,减少了人工选择特征的主观因素,提高了用户额度评估的速度,提升入模特征的合理性以及可解释性。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种基于融合算法的额度评分方法、装置、设备及存储介质。
背景技术
在小微企业客户信贷申请过程中,金融机构会给出客户的授信额度。针对额度较高的产品,往往需要审批官通过人工分析与核算给出授信额度。这样增加了贷款审批的时间,降低了客户友好度;针对额度较低的产品,目前市场上大部分金融机构都可以提供线上给出授信额度的模型,如果使用固定的特征输入模型则可能无法适应业务市场环境的变化,而动态调整入模特征类型时,为了保证的合理性以及可解释性,建模过程往往需要审批官的深度参与,且可能存在人机脱节的情况。并且在模型上线后,无法及时进行模型的迭代与调优。因此,如何在减少人工干预的情况下提升入模特征的合理性以及可解释性成为亟待解决的问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于融合算法的额度评分方法、装置、设备及存储介质,旨在解决现有技术如何在减少人工干预的情况下提升入模特征的合理性以及可解释性的技术问题。
为实现上述目的,本发明提供了一种基于融合算法的额度评分方法,所述方法包括以下步骤:
获取用户数据;
根据预设基础额度特征池对所述用户数据进行筛选得到第一入模数据;
将所述第一入模数据带入基础额度模型得到用户基础授信额度;
根据预设影响因子特征对所述用户数据进行筛选得到第二入模数据;
将所述第二入模数据带入影响因子模型得到影响参数;
根据所述用户基础授信额度和所述影响参数得到最终授信额度评分。
可选的,所述根据预设基础额度特征池对用户数据进行筛选得到第一入模数据的步骤之前,还包括:
获取样本数据以及样本数据对应的授信额度;
根据所述样本数据以及样本数据对应的授信额度得到多个备选特征以及各个备选特征对应的相关系数;
根据所述相关系数对多个所述备选特征进行筛选,得到筛选后的备选特征;
根据所述筛选后的备选特征构建预设基础额度特征池。
可选的,所述根据所述相关系数对多个所述备选特征进行筛选,得到筛选后的备选特征,包括:
根据所述相关系数选择预设个数的备选特征作为筛选后的备选特征;
或从多个所述备选特征中筛选出相关系数大于预设系数阈值的备选特征作为筛选后的备选特征。
可选的,所述用户数据包括企业基本信息数据、流水数据、征信数据、经营数据、多头信贷数据中的一种或多种。
可选的,所述根据预设影响因子特征对用户数据进行筛选得到第二入模数据的步骤之前,还包括:
获取样本数据;
根据所述样本数据得到备选影响因子特征;
根据预设影响因子筛选模型对备选影响因子特征进行筛选,得到预设影响因子特征。
可选的,所述根据预设影响因子筛选模型对备选影响因子特征进行筛选,得到预设影响因子特征,包括:
根据所述备选影响因子特征和预设融合算法模型得到至少两组影响因子特征集;
将各特征集取并集得到目标影响因子特征集;
对所述目标影响因子特征集进行重要性筛选,得到预设影响因子特征。
可选的,所述根据所述备选影响因子特征和预设融合算法模型得到至少两组影响因子特征集,包括:
根据预设权重算法计算出各个备选影响因子特征的权重值;
根据所述各个备选影响因子特征的权重值得到至少一组影响因子特征集;
根据预设经验算法计算出各个备选影响因子特征的重要性评分;
根据所述各个备选影响因子特征的重要性评分得到至少一组影响因子特征集。
此外,为实现上述目的,本发明还提出一种基于融合算法的额度评分装置,所述基于融合算法的额度评分装置包括:
获取模块,用于获取用户数据;
处理模块,用于根据预设基础额度特征池对用户数据进行筛选得到第一入模数据;
所述处理模块,还用于将所述第一入模数据带入基础额度模型得到用户基础授信额度;
所述处理模块,还用于根据预设影响因子特征对用户数据进行筛选得到第二入模数据;
所述处理模块,还用于将所述第二入模数据带入影响因子模型得到影响参数;
控制模块,用于根据所述用户基础授信额度和影响参数得到最终授信额度评分。
此外,为实现上述目的,本发明还提出一种基于融合算法的额度评分设备,所述基于融合算法的额度评分设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于融合算法的额度评分程序,所述基于融合算法的额度评分程序配置为实现如上文所述的基于融合算法的额度评分方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有基于融合算法的额度评分程序,所述基于融合算法的额度评分程序被处理器执行时实现如上文所述的基于融合算法的额度评分方法的步骤。
本发明获取用户数据;根据预设基础额度特征池对所述用户数据进行筛选得到第一入模数据;将所述第一入模数据带入基础额度模型得到用户基础授信额度;根据预设影响因子特征对所述用户数据进行筛选得到第二入模数据;将所述第二入模数据带入影响因子模型得到影响参数;根据所述用户基础授信额度和所述影响参数得到最终授信额度评分。通过上述方式实现了对入模数据的自动化筛选,通过对用户数据进行筛选选择从中选择部分用户数据作为入模特征得到影响参数和基础授信额度,进而得到符合当前市场环境的授信额度评分方法。减少了人工选择特征的主观因素,提高了用户额度评估的速度,提升入模特征的合理性以及可解释性。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的基于融合算法的额度评分设备的结构示意图;
图2为本发明基于融合算法的额度评分方法第一实施例的流程示意图;
图3为本发明基于融合算法的额度评分方法第二实施例的流程示意图;
图4为本发明基于融合算法的额度评分装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的基于融合算法的额度评分设备结构示意图。
如图1所示,该基于融合算法的额度评分设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对基于融合算法的额度评分设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于融合算法的额度评分程序。
在图1所示的基于融合算法的额度评分设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明基于融合算法的额度评分设备中的处理器1001、存储器1005可以设置在基于融合算法的额度评分设备中,所述基于融合算法的额度评分设备通过处理器1001调用存储器1005中存储的基于融合算法的额度评分程序,并执行本发明实施例提供的基于融合算法的额度评分方法。
本发明实施例提供了一种基于融合算法的额度评分方法,参照图2,图2为本发明一种基于融合算法的额度评分方法第一实施例的流程示意图。
本实施例中,所述基于融合算法的额度评分方法包括以下步骤:
步骤S10:获取用户数据。
需要说明的是,本实施例的执行主体为额度评分系统,所述额度评分系统可以为额度评分方的服务器系统,也可以为其他与服务器系统功能相同或者相似的其他系统,本实施例对额度评分系统的表现形式不加以限定。
可以理解的是,本是实施例应用于小型企业或者个人授信的过程中,通过将用户的数据输入模型中,得到用户的授信额度评分,进行判断用户的可贷款金额。而本发明设计的特征筛选方法,是基于多种算法以及人工筛选融合的方法对额度模型中的特征进行筛选并进行自动更新迭代,进而根据筛选后的特征对用户数据进行进行选取带入模型中得到在当前市场环境下更为准确的授信额度评分,降低了模型迭代滞后导致的额度预测不准确甚至影响资产质量的情况发生的概率。
在本实施例中,用户数据包括企业基本信息数据、流水数据、征信数据、经营数据、多头信贷数据中的一种或多种。其中,企业基本信息可以包括企业规模(例如:大、中、小型企业)、经营年限以及经营行业等等;经营数据可以包括不同时间段的利润、营业额、企业总资产、固定资产负债情况以及偿债情况等等;多头信贷数据可以包括一定时间段内的贷款申请机构数、经营性贷款逾期次数、贷款与贷记卡审批查询次数以及新增贷款笔数等。
步骤S20:根据预设基础额度特征池对所述用户数据进行筛选得到第一入模数据。
需要说明的是,基础额度为直接影响授信额度的部分因此决定基础信用额度的特征必须与授信额度之间有强相关性,预设基础额度特征池中存储着用于规定基础额度预测模型输入参数类型的数据。本实施例中,特征代表着数据的类型,每一个数据的指标类型为一个特征,例如:近一年净利润金额为一个特征,企业总资产为一个特征。
其中,第一入模数据为用于进行基础额度预测的输入数据,第一入模数据包括了预设基础额度特征池中,基础额度特征对应的数据种类,例如:基础额度特征为利润、营业额、企业总资产以及固定资产负债情况,那么根据基础额度特征就可以从用户数据中筛选出利润、营业额、企业总资产以及固定资产负债情况的数据,将这些数据作为第一入模数据带入基础额度预测模型中即可得到用户的基础授信额度。
在本实施例中,预设基础额度特征池的构建方式可以为:获取样本数据以及样本数据对应的授信额度;根据所述样本数据以及样本数据对应的授信额度得到多个备选特征以及各个备选特征对应的相关系数;根据所述相关系数对多个所述备选特征进行筛选,得到筛选后的备选特征;根据所述筛选后的备选特征构建预设基础额度特征池。通过计算样本数据和授信额度之间的相关性对样本数据进行排序,并根据排序结果对备选特征进行筛选,选择相关系数较高的部分样本数据作为筛选后的备选特征,进一步的构建预设基础额度特征池。
需要说明的是,样本数据中包含了多个种类的数据,每一个种类对应这一个备选特征和一个相关系数。
获取样本数据,其中包括企业基本信息、流水数据、征信数据、经营数据、多头信贷数据中的一种或多种;对所述训练数据样本中的各变量通过计算相关系数以及人工筛选的方式得到基础额度特征池以及入模特征;例如:获取小微企业的基本信息、流水数据、征信数据、经营数据、多头信贷数据,构造1000多维的原始特征池。
具体的,本实施例提出一种根据样本数据以及样本数据对应的授信额度得到多个备选特征以及各个备选特征对应的相关系数的优选方案如下:对所述训练数据样本中的各变量X通过计算与授信额度Y之间的相关系数得到特征与目标变量的相关性排序,筛选超过阈值的特征并记录对应的相关系数,构造备选特征池其中n1为A中特征的个数;相关系数的计算公式:结果的取值区间为[-1,1],-1表示完全的负相关,+1表示完全的正相关,0表示没有线性相关。对特征集A进行筛选与确认,得到n个特征作为基础额度特征集A*,其中A*={a1,a2,...,an},根据A*建立基础额度特征池。
在本实施例中,得到每个特征的相关系数后,根据相关系数对特征进行筛选的过程可以为:根据所述相关系数选择预设个数的备选特征作为筛选后的备选特征;或从多个所述备选特征中筛选出相关系数大于预设系数阈值的备选特征作为筛选后的备选特征。
其中,特征的筛选过程具体可以为:根据所述相关系数选择预设个数的备选特征作为筛选后的备选特征,即选择预设个数的备选特征,其中,被选中的备选特征为相关系数最高的几个备选特征。例如:预设个数为3个,那没就选择相关系数由高到低排序,排在前三位的备选特征。特征的筛选过程具体还可以为:从所有的备选特征中筛选出相关系数大于预设系数阈值的备选特征作为筛选后的备选特征,例如:预设系数阈值为0.3,那么选择相关系数的数值大于0.3的备选特征作为筛选后的备选特征。其中,筛选后的备选特征即为被选中用于构建基础额度特征池的特征。例如:通过衡量特征与授信额度之间的线性相关性,设定阈值或者待选择阈值的个数来选择特征。由于基础额度是直接影响授信额度的部分,因此考虑通过该算法筛选与最终授信额度具有强线性相关性的特征作为基础额度特征池中的特征。
本实施例通过对基础额度特征池中特征的筛选,保证了输入模型的数据为相关系数较高的数据类型,由于基础额度是直接影响授信额度的部分,因此考虑通过该算法筛选与最终授信额度具有强线性相关性的特征。
步骤S30:将所述第一入模数据带入基础额度模型得到用户基础授信额度。
需要说明的是,基础额度模型即为进行计算用户基础额度的模型,通过输入第一入模数据得到一个基础额度的输出,所述基础额度模型可以为神经网络模型,也可以为其他根据用户数据预测基础额度的模型,本实施例对模型的种类不加以限定。本实施例仅仅通过筛选输入参数的类型剔除相关性不高的数据以提高额度预测的准确度,降低系统冗余。
步骤S40:根据预设影响因子特征对所述用户数据进行筛选得到第二入模数据。
可以说明的是,第二入模数据为用于在基础额度上进行额度调整从而得到最终授信额度的参数,由于外部环境的不同,例如:在不同时间,不同市场环境下各类用户数据对授信额度的影响程度可能不同。需要根据客群变化、业务场景变化以及新的经验提取等对预设影响因子特征进行调整,进一步的筛选第二入模数据。
可以理解的是,除了筛选出与授信额度具有线性相关的特征即基础额度特征外,还可以通过以下算法进行非线性关系的特征筛选作为额度的影响因子。例如:J-S散度、随机森林、专家经验方法进行融合的原因:可相互弥补单一算法预测筛选的缺陷,使得额度预测的过程更加合理,结果更加准确。
步骤S50:将所述第二入模数据带入影响因子模型得到影响参数。
需要说明的是,影响因子模型即为进行计算用户影响参数的模型,通过输入第二入模数据得到影响参数,其中,影响参数用于对基础额度模型进行调整得到最终授信额度,具体的,影响参数可以为调整系数,将基础额度乘以调整系数得到最终准确的授信额度,所述影响因子模型可以为神经网络模型,可以为其他根据第二入模数预测影响参数的模型,本实施例对影响因子模型的模型种类不加以限定。
步骤S60:根据所述用户基础授信额度和所述影响参数得到最终授信额度评分。
在具体实现中,本实施例提出一种根据所述用户基础授信额度和所述影响参数得到最终授信额度评分的优选方案,如下,在用户基础授信额度的基础上结合影响参数计算出精确的最终授信额度评分,其中用户基础授信额度是根据预设基础额度特征池对用户数据筛选后的第一入模参数得到的,影响参数是根据预设影响因子特征对用户数据筛选后的第二入模参数得到的。通过预设基础额度特征池和预设影响因子特征的构建决定了基础额度模型和影响因子模型的入模参数类型,分别选取相关性和重要性较高的特征作为输入模型的数据,进而提高额度评分预测的准确度,降低系统冗余。
本实施例获取用户数据;根据预设基础额度特征池对所述用户数据进行筛选得到第一入模数据;将所述第一入模数据带入基础额度模型得到用户基础授信额度;根据预设影响因子特征对所述用户数据进行筛选得到第二入模数据;将所述第二入模数据带入影响因子模型得到影响参数;根据所述用户基础授信额度和所述影响参数得到最终授信额度评分。通过上述方式,实现了对入模数据的自动化筛选,通过对用户数据进行筛选选择从中选择部分用户数据作为入模特征得到影响参数和基础授信额度,进而得到符合当前市场环境的授信额度评分方法。减少了人工选择特征的主观因素,提高了用户额度评估的速度,提升入模特征的合理性以及可解释性。
参考图3,图3为本发明一种基于融合算法的额度评分方法第二实施例的流程示意图。
基于上述第一实施例,本实施例基于融合算法的额度评分方法在所述步骤S40之前,还包括:
步骤S41:获取样本数据。
需要说明的是,样本数据即用于筛选备选影响因子特征的数据,其中,样本数据可以包括:企业基本信息数据、流水数据、征信数据、经营数据、多头信贷数据中的一种或多种。其中,企业基本信息可以包括企业规模(例如:大、中、小型企业)、经营年限以及经营行业等等;经营数据可以包括不同时间段的利润、营业额、企业总资产、固定资产负债情况以及偿债情况等等;多头信贷数据可以包括一定时间段内的贷款申请机构数、经营性贷款逾期次数、贷款与贷记卡审批查询次数以及新增贷款笔数等,本实施例对样本数据的类型不加以限定。
步骤S42:根据所述样本数据得到备选影响因子特征。
需要说明的是,备选影响因子特征为,在用户数据所包含的特征中去除预设基础额度特征池中特征后,其他特征的集合。这是因为,需要筛选出相关性最强特征作为用于计算基础额度的特征,保证了最终授信额度的合理性和可解释性。再从其他的特征中选择相对重要的特征对基础授信额度进行调整。
步骤S43:根据预设影响因子筛选模型对备选影响因子特征进行筛选,得到预设影响因子特征。
需要说明的是,在本方案中预设影响因子筛选模型,可以为多种算法组成的运算模型,通过不同的算法计算不同特征的权重,将权重较大的特征筛选出来作为预设影响因子特征。
在本实施例中,根据所述备选影响因子特征和预设融合算法模型得到至少两组影响因子特征集;将各特征集取并集得到目标影响因子特征集;对所述目标影响因子特征集进行重要性筛选,得到预设影响因子特征。
其中,重要性指的是特征的重要性,是一个衡量每个输入模型的数据类型对模型预测结果贡献的指标,即某个特征上的变化对预测结果的影响程度,重要性越强代表用该特征来预测额度的准确性越高。
在本实施例中,根据预设权重算法计算出各个备选影响因子特征的权重值;根据所述各个备选影响因子特征的权重值得到至少一组影响因子特征集;根据预设经验算法计算出各个备选影响因子特征的重要性评分;根据所述各个备选影响因子特征的重要性评分得到至少一组影响因子特征集。
在具体实现中,本实施例提出一种计算影响因子特征集的优选方案,对所述备选影响因子特征的变量通过J-S散度算法计算权重,按照权重由大到小排序后筛选超过阈值的特征集其中n2为B中特征的个数;对备选影响因子特征的变量通过随机森林算法计算权重,按照权重由大到小排序后筛选超过阈值的特征集其中n3为C中特征的个数;对备选影响因子特征的变量通过专家经验筛选的方式,按照重要性由高到低排序后得到特征集其中n4为D中特征的个数;将特征集B、C、D取并集得到备选特征池P。
其中,特征集B、C以及D均为影响影子特征集,特征集P即为目标影响因子特征集。其中包含了多个影响因子特征。再根据数量、重要性或者其他指标对影响因子特征进行筛选,即可得到预设影响因子特征。
在具体实现中,选取上述多种算法融合进行计算是因为,首先,J-S散度算法,相对熵计算法,从不同额度下各特征分布之间的差异性来判断该特征是否具有很好的预测能力。差异越大的特征预测能力越强,过于独立。只关注单一特征对授信额度的预测能力。其次,随机森林嵌入法,先使用该算法对样本进行训练,得到各个特征的权值系数,根据系数从大到小选择特征。模型筛选出的特征大部分可解释性不强。最后,专家经验根据审批专家长期的经验积累,提炼授信过程中关注的特征,按照关注度由高到低进行排序筛选,具有强可解释性。缺点是主观性太强,过于依赖专家的经验积累。因此通过多种算法相融合对特征进行筛选,可相互弥补单一算法预测筛选的缺陷。
本实施例获取样本数据;根据所述样本数据得到备选影响因子特征;根据预设影响因子筛选模型对备选影响因子特征进行筛选,得到预设影响因子特征。通过上述方式,实现了预设影响因子特征的构建过程,通过多种算法融合对备选影响因子特征进行筛选,可相互弥补单一算法预测筛选的缺陷,使得额度预测的过程更加合理,结果更加准确,提高了额度评分的准确度。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于融合算法的额度评分程序,所述基于融合算法的额度评分程序被处理器执行时实现如上文所述的基于融合算法的额度评分方法的步骤。
由于本存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不一一赘述。
参照图4,图4为本发明基于融合算法的额度评分装置第一实施例的结构框图。
如图4所示,本发明实施例提出的基于融合算法的额度评分装置包括:
获取模块10,用于获取用户数据;
处理模块20,用于根据预设基础额度特征池对用户数据进行筛选得到第一入模数据;
所述处理模块20,还用于将所述第一入模数据带入基础额度模型得到用户基础授信额度;
所述处理模块20,还用于根据预设影响因子特征对用户数据进行筛选得到第二入模数据;
所述处理模块20,还用于将所述第二入模数据带入影响因子模型得到影响参数;
控制模块30,用于根据所述用户基础授信额度和影响参数得到最终授信额度评分。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
本实施例获取模块10获取用户数据;处理模块20根据预设基础额度特征池对所述用户数据进行筛选得到第一入模数据;处理模块20将所述第一入模数据带入基础额度模型得到用户基础授信额度;处理模块20根据预设影响因子特征对所述用户数据进行筛选得到第二入模数据;处理模块20将所述第二入模数据带入影响因子模型得到影响参数;控制模块30根据所述用户基础授信额度和所述影响参数得到最终授信额度评分。通过上述方式,实现了对入模数据的自动化筛选,通过对用户数据进行筛选选择从中选择部分用户数据作为入模特征得到影响参数和基础授信额度,进而得到符合当前市场环境的授信额度评分方法。减少了人工选择特征的主观因素,提高了用户额度评估的速度,提升入模特征的合理性以及可解释性。
由于本装置采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不一一赘述。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于融合算法的额度评分方法,此处不再赘述。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于融合算法的额度评分方法,其特征在于,所述基于融合算法的额度评分方法包括:
获取用户数据;
根据预设基础额度特征池对所述用户数据进行筛选得到第一入模数据;
将所述第一入模数据带入基础额度模型得到用户基础授信额度;
根据预设影响因子特征对所述用户数据进行筛选得到第二入模数据;
将所述第二入模数据带入影响因子模型得到影响参数;
根据所述用户基础授信额度和所述影响参数得到最终授信额度评分。
2.如权利要求1所述的方法,其特征在于,所述根据预设基础额度特征池对用户数据进行筛选得到第一入模数据的步骤之前,还包括:
获取样本数据以及样本数据对应的授信额度;
根据所述样本数据以及样本数据对应的授信额度得到多个备选特征以及各个备选特征对应的相关系数;
根据所述相关系数对多个所述备选特征进行筛选,得到筛选后的备选特征;
根据所述筛选后的备选特征构建预设基础额度特征池。
3.如权利要求2所述的方法,其特征在于,所述根据所述相关系数对多个所述备选特征进行筛选,得到筛选后的备选特征,包括:
根据所述相关系数选择预设个数的备选特征作为筛选后的备选特征;
或从多个所述备选特征中筛选出相关系数大于预设系数阈值的备选特征作为筛选后的备选特征。
4.如权利要求1所述的方法,其特征在于,所述用户数据包括企业基本信息数据、流水数据、征信数据、经营数据、多头信贷数据中的一种或多种。
5.如权利要求1所述的方法,其特征在于,所述根据预设影响因子特征对用户数据进行筛选得到第二入模数据的步骤之前,还包括:
获取样本数据;
根据所述样本数据得到备选影响因子特征;
根据预设影响因子筛选模型对备选影响因子特征进行筛选,得到预设影响因子特征。
6.如权利要求5所述的方法,其特征在于,所述根据预设影响因子筛选模型对备选影响因子特征进行筛选,得到预设影响因子特征,包括:
根据所述备选影响因子特征和预设融合算法模型得到至少两组影响因子特征集;
将各特征集取并集得到目标影响因子特征集;
对所述目标影响因子特征集进行重要性筛选,得到预设影响因子特征。
7.如权利要求6所述的方法,其特征在于,所述根据所述备选影响因子特征和预设融合算法模型得到至少两组影响因子特征集,包括:
根据预设权重算法计算出各个备选影响因子特征的权重值;
根据所述各个备选影响因子特征的权重值得到至少一组影响因子特征集;
根据预设经验算法计算出各个备选影响因子特征的重要性评分;
根据所述各个备选影响因子特征的重要性评分得到至少一组影响因子特征集。
8.一种基于融合算法的额度评分装置,其特征在于,所述基于融合算法的额度评分装置包括:
获取模块,用于获取用户数据;
处理模块,用于根据预设基础额度特征池对用户数据进行筛选得到第一入模数据;
所述处理模块,还用于将所述第一入模数据带入基础额度模型得到用户基础授信额度;
所述处理模块,还用于根据预设影响因子特征对用户数据进行筛选得到第二入模数据;
所述处理模块,还用于将所述第二入模数据带入影响因子模型得到影响参数;
控制模块,用于根据所述用户基础授信额度和影响参数得到最终授信额度评分。
9.一种基于融合算法的额度评分设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于融合算法的额度评分程序,所述基于融合算法的额度评分程序配置为实现如权利要求1至7中任一项所述的基于融合算法的额度评分方法。
10.一种存储介质,其特征在于,所述存储介质上存储有基于融合算法的额度评分程序,所述基于融合算法的额度评分程序被处理器执行时实现如权利要求1至7任一项所述的基于融合算法的额度评分方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111297149.7A CN114004691A (zh) | 2021-11-03 | 2021-11-03 | 基于融合算法的额度评分方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111297149.7A CN114004691A (zh) | 2021-11-03 | 2021-11-03 | 基于融合算法的额度评分方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114004691A true CN114004691A (zh) | 2022-02-01 |
Family
ID=79927040
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111297149.7A Pending CN114004691A (zh) | 2021-11-03 | 2021-11-03 | 基于融合算法的额度评分方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114004691A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116089809A (zh) * | 2023-04-07 | 2023-05-09 | 平安银行股份有限公司 | 金融特征数据的筛选方法、装置、电子设备及存储介质 |
CN117291702A (zh) * | 2023-11-23 | 2023-12-26 | 深圳市金政软件技术有限公司 | 现金分存方法、装置、设备及存储介质 |
-
2021
- 2021-11-03 CN CN202111297149.7A patent/CN114004691A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116089809A (zh) * | 2023-04-07 | 2023-05-09 | 平安银行股份有限公司 | 金融特征数据的筛选方法、装置、电子设备及存储介质 |
CN117291702A (zh) * | 2023-11-23 | 2023-12-26 | 深圳市金政软件技术有限公司 | 现金分存方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108564286B (zh) | 一种基于大数据征信的人工智能金融风控授信评定方法和系统 | |
CN112734559B (zh) | 企业信用风险评价方法、装置及电子设备 | |
CN114004691A (zh) | 基于融合算法的额度评分方法、装置、设备及存储介质 | |
CN106295351B (zh) | 一种风险识别方法及装置 | |
CN114048436A (zh) | 一种预测企业财务数据模型构建方法及构建装置 | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
CN113919886A (zh) | 基于夏普利值的数据特征组合定价方法、系统及电子设备 | |
CN110866832A (zh) | 一种风险控制方法、系统、存储介质及计算设备 | |
CN114219242A (zh) | 车辆装备的效能评估方法及效能评估体系构建系统 | |
CN114943582A (zh) | 一种信息推荐方法、系统及推荐服务器 | |
CN114493686A (zh) | 一种运营内容生成推送方法及装置 | |
CN113435713B (zh) | 基于gis技术和两模型融合的风险地图编制方法及系统 | |
CN117132383A (zh) | 一种信贷数据处理方法、装置、设备及可读存储介质 | |
CN116912016A (zh) | 一种账单稽核方法和装置 | |
CN115660608A (zh) | 一种一站式的创新创业孵化方法 | |
CN115719183A (zh) | 基于权重动态分级的电力客户自反馈服务评价方法及系统 | |
CN115660822A (zh) | 用于金融业务的风控策略处理方法以及装置、电子设备、存储介质 | |
CN116091200A (zh) | 基于机器学习的场景授信系统、方法、电子设备及介质 | |
CN115099933A (zh) | 一种业务预算方法、装置及设备 | |
CN114693428A (zh) | 数据确定方法、装置、计算机可读存储介质及电子设备 | |
CN117252677A (zh) | 信贷额度确定方法和装置、电子设备及存储介质 | |
CN113313582A (zh) | 拒客回捞模型训练方法、装置及电子设备 | |
AU2020201689A1 (en) | Cognitive forecasting | |
CN114004692A (zh) | 额度模型迭代方法、装置、设备及存储介质 | |
CN110599350A (zh) | 一种用户金融投资偏好的评测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |