CN114092229A - 计算授信额度的方法、装置、电子设备和计算机可读介质 - Google Patents
计算授信额度的方法、装置、电子设备和计算机可读介质 Download PDFInfo
- Publication number
- CN114092229A CN114092229A CN202111413367.2A CN202111413367A CN114092229A CN 114092229 A CN114092229 A CN 114092229A CN 202111413367 A CN202111413367 A CN 202111413367A CN 114092229 A CN114092229 A CN 114092229A
- Authority
- CN
- China
- Prior art keywords
- sample
- credit line
- users
- credit
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了计算授信额度的方法、装置、电子设备和计算机可读介质,涉及大数据数据分析技术领域。该方法的一具体实施方式包括:根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度;根据所述各个历史用户的授信额度,从所述各个历史用户中筛选出样本用户;根据所述样本用户的用户数据训练模型,从而得到授信额度模型;通过所述授信额度模型计算目标用户的授信额度。该实施方式能够解决授信额度计算不准确的技术问题。
Description
技术领域
本发明涉及大数据数据分析技术领域,尤其涉及一种计算授信额度的方法、装置、电子设备和计算机可读介质。
背景技术
在信贷业务中,算法模型运用在用户营销、风险评估等方面较多。用户的授信额度一般依赖于由业务专家制定好的授信规则给出相应额度。传统的授信规则方法更依赖于专家业务经验,对于规则和用户真实的额度需求缺乏数据验证。如果通过建立额度模型深入挖掘特征和用户额度需求的关系时,则面临着模型目标变量定义模糊的问题。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有的额度模型目标变量常用的方法是取样本用户在本机构或征信报告上显示其他机构给出的授信额度作为参考。但是以用户在本机构或征信报告上显示其他机构给出的授信额度作为参考主要存在以下问题:
由于授信额度一般根据经验规则或公式给出,并不一定是最合理的授信额度,可能会超过或低过用户的贷款需求,导致建立额度模型后,模型给出的额度值偏高或者偏低。
发明内容
有鉴于此,本发明实施例提供一种计算授信额度的方法、装置、电子设备和计算机可读介质,以解决授信额度计算不准确的技术问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种计算授信额度的方法,包括:
根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度;
根据所述各个历史用户的授信额度,从所述各个历史用户中筛选出样本用户;
根据所述样本用户的用户数据训练模型,从而得到授信额度模型;
通过所述授信额度模型计算目标用户的授信额度。
可选地,根据观察时点之后的贷款余额最大值,标记各个历史用户的授信额度,包括:
定义样本观察时点;
对于每个历史用户,计算在所述样本观察时点之后各个月的贷款余额;
对于每个历史用户,从所述各个月的贷款余额中筛选出贷款余额最大值,并将所述贷款余额最大值标记为所述历史用户的授信额度。
可选地,计算在所述样本观察时点之后各个月的贷款余额,包括:
对于所述样本观察时点之后的每个月,所述贷款余额为所述月内各个类型的贷款的余额之和。
可选地,定义样本观察时点,包括:
确定样本月份的数量N;其中,N大于等于6;
以距离当前时点N个月的时点作为样本观察时点。
可选地,根据所述各个历史用户的授信额度,从所述各个历史用户中筛选出样本用户,包括:
根据授信额度的目标区间,从所述各个历史用户中筛选出待定用户,以使各个待定用户的授信额度在所述授信额度的目标区间之内;
根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户。
可选地,根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户,包括:
根据所述各个待定用户的授信额度,计算所述授信额度的样本均值和样本标准差;
根据所述授信额度的样本均值和样本标准差,计算授信额度阈值;
从所述各个待定用户中筛选出授信额度小于等于所述授信额度阈值的样本用户。
可选地,所述授信额度阈值采用以下公式计算:
授信额度阈值=授信额度的样本均值+W×授信额度的标准差;
其中,W大于等于2且小于等于5。
可选地,根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户之后,还包括:
从所述样本用户中剔除贷款发生过逾期的用户。
另外,根据本发明实施例的另一个方面,提供了一种计算授信额度的装置,包括:
标记模块,用于根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度;
筛选模块,用于根据所述各个历史用户的授信额度,从所述各个历史用户中筛选出样本用户;
训练模块,用于根据所述样本用户的用户数据训练模型,从而得到授信额度模型;
计算模块,用于通过所述授信额度模型计算目标用户的授信额度。
可选地,所述标记模块还用于:
定义样本观察时点;
对于每个历史用户,计算在所述样本观察时点之后各个月的贷款余额;
对于每个历史用户,从所述各个月的贷款余额中筛选出贷款余额最大值,并将所述贷款余额最大值标记为所述历史用户的授信额度。
可选地,所述标记模块还用于:
对于所述样本观察时点之后的每个月,所述贷款余额为所述月内各个类型的贷款的余额之和。
可选地,所述标记模块还用于:
确定样本月份的数量N;其中,N大于等于6;
以距离当前时点N个月的时点作为样本观察时点。
可选地,所述筛选模块还用于:
根据授信额度的目标区间,从所述各个历史用户中筛选出待定用户,以使各个待定用户的授信额度在所述授信额度的目标区间之内;
根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户。
可选地,所述筛选模块还用于:
根据所述各个待定用户的授信额度,计算所述授信额度的样本均值和样本标准差;
根据所述授信额度的样本均值和样本标准差,计算授信额度阈值;
从所述各个待定用户中筛选出授信额度小于等于所述授信额度阈值的样本用户。
可选地,所述授信额度阈值采用以下公式计算:
授信额度阈值=授信额度的样本均值+W×授信额度的标准差;
其中,W大于等于2且小于等于5。
可选地,所述筛选模块还用于:
根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户之后,从所述样本用户中剔除贷款发生过逾期的用户。
根据本发明实施例的另一个方面,还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现上述任一实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种计算机程序产品,包括计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为采用根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度,根据各个历史用户的授信额度筛选出样本用户,从而训练得到授信额度模型,然后通过授信额度模型计算用户的授信额度的技术手段,所以克服了现有技术中授信额度计算不准确的技术问题。本发明实施例通过将样本观察时点之后的贷款余额最大值标记为历史用户的授信额度,解决了授信额度模型目标变量定义模糊的问题,通过样本观察时点之后的贷款余额最大值计算历史用户合理的授信额度,为后续模型开发奠定基础,使得训练好的授信额度模型计算出合适的授信额度;而且本发明实施例进一步根据历史用户的授信额度筛选出合适的样本用户,剔除异常样本,保证整体样本的合理性。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明第一实施例的计算授信额度的方法的主要流程的示意图;
图2是根据本发明第二实施例的计算授信额度的方法的主要流程的示意图;
图3是根据本发明第二实施例的观察时点的示意图;
图4是根据本发明第三实施例的计算授信额度的方法的主要流程的示意图;
图5是根据本发明实施例的计算授信额度的装置的主要模块的示意图;
图6是本发明实施例可以应用于其中的示例性系统架构图;
图7是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
图1是根据本发明第一实施例的计算授信额度的方法的主要流程的示意图。作为本发明的一个实施例,如图1所示,所述计算授信额度的方法可以包括:
步骤101,根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度。
为了训练出能够准确计算授信额度的授信额度模型,首先需要标记出各个历史用户的标签,在本发明的实施例中,可以根据样本观察时点之后的贷款余额最大值来标记出各个历史用户的授信额度。
可选地,步骤101可以包括:定义样本观察时点;对于每个历史用户,计算在所述样本观察时点之后各个月的贷款余额;对于每个历史用户,从所述各个月的贷款余额中筛选出贷款余额最大值,并将所述贷款余额最大值标记为所述历史用户的授信额度。首先在时间轴上定义出样本观察时点,然后对于每个历史用户,分别计算在所述样本观察时点之后每个月的贷款余额,接着对于每个历史用户,从该历史用户的每个月的贷款余额中筛选出贷款余额最大值(即最大的贷款余额),并将所述贷款余额最大值标记为该历史用户的授信额度。因此,通过贷款余额最大值来标记历史用户的授信额度,可以准确地反映出用户在样本观察时点之后的N个月内可承受的最大贷款资金量。
可选地,定义样本观察时点,可以包括:确定样本月份的数量N;其中,N大于等于6;以距离当前时点N个月的时点作为样本观察时点。可以预先设定样本月份的数量N,N可以取值为6、8、9、12、15或者18等。如果N取值为6,那么样本观察时点即为距离当前时点6个月的时点;如果N取值为12,那么样本观察时点即为距离当前时点12个月的时点。因此,本发明实施例将模型的目标变量授信额度定义为用户在样本观察时点之后的N个月内贷款余额的最大值。
可选地,计算在所述样本观察时点之后各个月的贷款余额,可以包括:对于所述样本观察时点之后的每个月,所述贷款余额为所述月内各个类型的贷款的余额之和。如果N取值为12,那么计算历史用户在样本观察时点之后的12个月内,每个月月末时点各个类型的贷款的余额之和,即为M1余额、M2余额、…、M12余额。例如,如果本次建模是针对信用类的贷款,则计算样本用户在样本观察点之后的12个月内,每个月月末时点所有信用贷款余额之和。因此,筛选出这12个月内每个月月末时点所有信用贷款余额之和中的最大值,即M1余额、M2余额、…、M12余额中的最大值。
步骤102,根据所述各个历史用户的授信额度,从所述各个历史用户中筛选出样本用户。
对每个历史用户标记出授信额度之后,根据所述各个历史用户的授信额度大小,剔除掉异常的历史用户,从而筛选出样本用户。
可选地,步骤102可以包括:根据授信额度的目标区间,从所述各个历史用户中筛选出待定用户,以使各个待定用户的授信额度在所述授信额度的目标区间之内;根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户。为了剔除掉授信额度过大和过小的历史用户,可以预先设定授信额度的目标区间,然后根据授信额度的目标区间从历史用户中筛选出待定用户,使得各个待定用户的授信额度都在该目标区间之内,比如授信额度的目标区间为[10000元,1000万元],则从历史用户中筛选出授信额度大于等于10000元且小于等于1000万元的待定用户。接着,根据各个待定用户的授信额度,从待定用户中筛选出样本用户,本发明实施例通过目标区间先剔除掉授信额度过大和过小的历史用户,再对保留下来的待定用户进一步分析,不但可以筛选出合适的样本用户,还可以减少筛选样本用户时的计算量。
可选地,根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户,包括:根据所述各个待定用户的授信额度,计算所述授信额度的样本均值和样本标准差;根据所述授信额度的样本均值和样本标准差,计算授信额度阈值;从所述各个待定用户中筛选出授信额度小于等于所述授信额度阈值的样本用户。为了从待定用户中筛选出合适的样本用户,排除异常值影响,可以根据各个待定用户的授信额度计算授信额度的样本均值和样本标准差,然后根据授信额度的样本均值和样本标准差计算授信额度阈值,从而从待定用户中筛选出授信额度小于等于授信额度阈值的样本用户,这样保证了样本整体的业务合理性,为后续模型开发奠定基础。
可选地,所述授信额度阈值采用以下公式计算:
授信额度阈值=授信额度的样本均值+W×授信额度的标准差;
其中,W大于等于2且小于等于5。
例如,为排除异常值影响,剔除掉授信额度>授信额度的样本均值+3×授信额度的标准差的待定用户,保留下的用户即为样本用户。
可选地,根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户之后,还包括:从所述样本用户中剔除贷款发生过逾期的用户。本发明实施例进一步排除贷款发生过逾期的样本用户,比如逾期30天的样本用户,用户发生逾期说明贷款额度已经超出该用户的承受能力,需要排除。
可选地,还可以根据业务场景进一步对历史用户进行筛选,保证整体样本合理性。比如针对小微企业的贷款业务,则筛选出符合小微企业条件的历史用户。
步骤103,根据所述样本用户的用户数据训练模型,从而得到授信额度模型。
筛选出样本用户之后,根据所述样本用户的用户数据和步骤101中标记出的授信额度训练模型,从而得到授信额度模型。
步骤104,通过所述授信额度模型计算目标用户的授信额度。
训练好授信额度模型后,将目标用户的用户数据输入到授信额度模型中,所述授信额度模型会计算出该目标用户的授信额度,也就是该目标用户在未来N个月内可承受的最大贷款资金量。
传统方法中主要依赖用户历史贷款中授信额度做目标变量,历史贷款的授信依赖于专家经验制定的授信规则和公式,可能会对用户授信额度做出误判。本发明实施例相较于传统的目标定义方法,使用样本观察时点之后N个月内贷款余额之和的最大值,并通过样本筛选时对用户样本进行进一步筛选,留下正常还款的用户样本,则样本的授信额度即代表了用户真实需求,也是在用户还款能力之内的,因此本发明实施例能够保证目标变量设定的合理性,为后续模型开发奠定基础。
根据上面所述的各种实施例,可以看出本发明实施例通过根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度,根据各个历史用户的授信额度筛选出样本用户,从而训练得到授信额度模型,然后通过授信额度模型计算用户的授信额度的技术手段,解决了现有技术中授信额度计算不准确的技术问题。本发明实施例通过将样本观察时点之后的贷款余额最大值标记为历史用户的授信额度,解决了授信额度模型目标变量定义模糊的问题,通过样本观察时点之后的贷款余额最大值计算历史用户合理的授信额度,为后续模型开发奠定基础,使得训练好的授信额度模型计算出合适的授信额度;而且本发明实施例进一步根据历史用户的授信额度筛选出合适的样本用户,剔除异常样本,保证整体样本的合理性。
图2是根据本发明第二实施例的计算授信额度的方法的主要流程的示意图。作为本发明的又一个实施例,如图2所示,所述计算授信额度的方法可以包括:
步骤201,确定样本月份的数量N,以距离当前时点N个月的时点作为样本观察时点。其中,N大于等于6。
如图3所示,首先在时间轴上定义出样本观察时点,可以预先设定样本月份的数量N,N可以取值为6、10、12、15或者24等。如果N取值为10,那么样本观察时点即为距离当前时点10个月的时点;如果N取值为24,那么样本观察时点即为距离当前时点24个月的时点。因此,本发明实施例将模型的目标变量授信额度定义为用户在样本观察时点之后的N个月内贷款余额的最大值。
步骤202,对于每个历史用户,计算在所述样本观察时点之后各个月的贷款余额。
对于每个历史用户,分别计算在所述样本观察时点之后每个月的贷款余额;其中,对于所述样本观察时点之后的每个月,所述贷款余额为所述月内各个类型的贷款的余额之和。如图3所示,如果N取值为12,那么计算历史用户在样本观察时点之后的12个月内,每个月月末时点各个类型的贷款的余额之和,即为M1余额、M2余额、…、M12余额。
步骤203,对于每个历史用户,从所述各个月的贷款余额中筛选出贷款余额最大值,并将所述贷款余额最大值标记为所述历史用户的授信额度。
接着对于每个历史用户,从该历史用户的每个月的贷款余额中筛选出贷款余额最大值(即最大的贷款余额),并将所述贷款余额最大值标记为该历史用户的授信额度。本发明实施例通过贷款余额最大值来标记历史用户的授信额度,可以准确地反映出用户在样本观察时点之后的N个月内可承受的最大贷款资金量。
例如,如果本次建模是针对信用类的贷款,则计算样本用户在样本观察点之后的12个月内,每个月月末时点所有信用贷款余额之和。因此,筛选出这12个月内每个月月末时点所有信用贷款余额之和中的最大值,即M1余额、M2余额、…、M12余额中的最大值,作为历史用户的授信额度。
步骤204,根据所述各个历史用户的授信额度,从所述各个历史用户中筛选出样本用户。
对每个历史用户标记出授信额度之后,根据所述各个历史用户的授信额度大小,剔除掉异常的历史用户,从而筛选出样本用户。可选地,步骤204可以包括:根据授信额度的目标区间,从所述各个历史用户中筛选出待定用户,以使各个待定用户的授信额度在所述授信额度的目标区间之内;根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户。为了剔除掉授信额度过大和过小的历史用户,可以预先设定授信额度的目标区间,然后根据授信额度的目标区间从历史用户中筛选出待定用户,使得各个待定用户的授信额度都在该目标区间之内,接着,根据各个待定用户的授信额度,从待定用户中筛选出样本用户,本发明实施例通过目标区间先剔除掉授信额度过大和过小的历史用户,再对保留下来的待定用户进一步分析,不但可以筛选出合适的样本用户,还可以减少筛选样本用户时的计算量。
步骤205,根据所述样本用户的用户数据训练模型,从而得到授信额度模型。
筛选出样本用户之后,根据所述样本用户的用户数据和步骤303中标记出的授信额度训练模型,从而得到授信额度模型。
步骤206,通过所述授信额度模型计算目标用户的授信额度。
训练好授信额度模型后,将目标用户的用户数据输入到授信额度模型中,所述授信额度模型会计算出该目标用户的授信额度,也就是该目标用户在未来N个月内可承受的最大贷款资金量。
另外,在本发明第二实施例中计算授信额度的方法的具体实施内容,在上面所述计算授信额度的方法中已经详细说明了,故在此重复内容不再说明。
图4是根据本发明第三实施例的计算授信额度的方法的主要流程的示意图。作为本发明的另一个实施例,如图4所示,所述计算授信额度的方法可以包括:
步骤401,根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度。
为了训练出能够准确计算授信额度的授信额度模型,首先需要标记出各个历史用户的标签,在本发明的实施例中,可以根据样本观察时点之后的贷款余额最大值来标记出各个历史用户的授信额度。
步骤402,根据授信额度的目标区间,从所述各个历史用户中筛选出待定用户,以使各个待定用户的授信额度在所述授信额度的目标区间之内。
为了剔除掉授信额度过大和过小的历史用户,可以预先设定授信额度的目标区间,然后根据授信额度的目标区间从历史用户中筛选出待定用户,使得各个待定用户的授信额度都在该目标区间之内,比如授信额度的目标区间为[20000元,2000万元],则从历史用户中筛选出授信额度大于等于20000元且小于等于2000万元的待定用户。
步骤403,根据所述各个待定用户的授信额度,计算所述授信额度的样本均值和样本标准差。
步骤404,根据所述授信额度的样本均值和样本标准差,计算授信额度阈值。
为了从待定用户中筛选出合适的样本用户,排除异常值影响,可以根据各个待定用户的授信额度计算授信额度的样本均值和样本标准差,然后根据授信额度的样本均值和样本标准差计算授信额度阈值,从而从待定用户中筛选出授信额度小于等于授信额度阈值的样本用户,这样保证了样本整体的业务合理性,为后续模型开发奠定基础。
可选地,所述授信额度阈值采用以下公式计算:
授信额度阈值=授信额度的样本均值+W×授信额度的标准差;
其中,W大于等于2且小于等于5。
步骤405,从所述各个待定用户中筛选出授信额度小于等于所述授信额度阈值的样本用户。
例如,为排除异常值影响,剔除掉授信额度>授信额度的样本均值+4×授信额度的标准差的待定用户,保留下的用户即为样本用户。
步骤406,从所述样本用户中剔除贷款发生过逾期的用户。
本发明实施例进一步排除贷款发生过逾期的样本用户,比如逾期30天的样本用户,用户发生逾期说明贷款额度已经超出该用户的承受能力,需要排除。
步骤407,根据所述样本用户的用户数据训练模型,从而得到授信额度模型。
步骤408,通过所述授信额度模型计算目标用户的授信额度。
另外,在本发明第三实施例中计算授信额度的方法的具体实施内容,在上面所述计算授信额度的方法中已经详细说明了,故在此重复内容不再说明。
图5是根据本发明实施例的计算授信额度的装置的主要模块的示意图,如图5所示,所述计算授信额度的装置500包括标记模块501、筛选模块502、训练模块503和计算模块504;其中,标记模块501用于根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度;筛选模块502用于根据所述各个历史用户的授信额度,从所述各个历史用户中筛选出样本用户;训练模块503用于根据所述样本用户的用户数据训练模型,从而得到授信额度模型;计算模块504用于通过所述授信额度模型计算目标用户的授信额度。
可选地,所述标记模块501还用于:
定义样本观察时点;
对于每个历史用户,计算在所述样本观察时点之后各个月的贷款余额;
对于每个历史用户,从所述各个月的贷款余额中筛选出贷款余额最大值,并将所述贷款余额最大值标记为所述历史用户的授信额度。
可选地,所述标记模块501还用于:
对于所述样本观察时点之后的每个月,所述贷款余额为所述月内各个类型的贷款的余额之和。
可选地,所述标记模块501还用于:
确定样本月份的数量N;其中,N大于等于6;
以距离当前时点N个月的时点作为样本观察时点。
可选地,所述筛选模块502还用于:
根据授信额度的目标区间,从所述各个历史用户中筛选出待定用户,以使各个待定用户的授信额度在所述授信额度的目标区间之内;
根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户。
可选地,所述筛选模块502还用于:
根据所述各个待定用户的授信额度,计算所述授信额度的样本均值和样本标准差;
根据所述授信额度的样本均值和样本标准差,计算授信额度阈值;
从所述各个待定用户中筛选出授信额度小于等于所述授信额度阈值的样本用户。
可选地,所述授信额度阈值采用以下公式计算:
授信额度阈值=授信额度的样本均值+W×授信额度的标准差;
其中,W大于等于2且小于等于5。
可选地,所述筛选模块502还用于:
根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户之后,从所述样本用户中剔除贷款发生过逾期的用户。
根据上面所述的各种实施例,可以看出本发明实施例通过根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度,根据各个历史用户的授信额度筛选出样本用户,从而训练得到授信额度模型,然后通过授信额度模型计算用户的授信额度的技术手段,解决了现有技术中授信额度计算不准确的技术问题。本发明实施例通过将样本观察时点之后的贷款余额最大值标记为历史用户的授信额度,解决了授信额度模型目标变量定义模糊的问题,通过样本观察时点之后的贷款余额最大值计算历史用户合理的授信额度,为后续模型开发奠定基础,使得训练好的授信额度模型计算出合适的授信额度;而且本发明实施例进一步根据历史用户的授信额度筛选出合适的样本用户,剔除异常样本,保证整体样本的合理性。
需要说明的是,在本发明所述计算授信额度的装置的具体实施内容,在上面所述计算授信额度的方法中已经详细说明了,故在此重复内容不再说明。
图6示出了可以应用本发明实施例的计算授信额度的方法或计算授信额度的装置的示例性系统架构600。
如图6所示,系统架构600可以包括终端设备601、602、603,网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备601、602、603通过网络604与服务器605交互,以接收或发送消息等。终端设备601、602、603上可以安装有各种通讯用户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱用户端、社交平台软件等(仅为示例)。
终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器605可以是提供各种服务的服务器,例如对用户利用终端设备601、602、603所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的物品信息查询请求等数据进行分析等处理,并将处理结果反馈给终端设备。
需要说明的是,本发明实施例所提供的计算授信额度的方法一般由服务器605执行,相应地,所述计算授信额度的装置一般设置在服务器605中。本发明实施例所提供的计算授信额度的方法也可以由终端设备601、602、603执行,相应地,所述计算授信额度的装置可以设置在终端设备601、602、603中。
应该理解,图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图7,其示出了适于用来实现本发明实施例的终端设备的计算机系统700的结构示意图。图7示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括标记模块、筛选模块、训练模块和计算模块,其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,该设备实现如下方法:根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度;根据所述各个历史用户的授信额度,从所述各个历史用户中筛选出样本用户;根据所述样本用户的用户数据训练模型,从而得到授信额度模型;通过所述授信额度模型计算目标用户的授信额度。
根据本发明实施例的技术方案,因为采用根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度,根据各个历史用户的授信额度筛选出样本用户,从而训练得到授信额度模型,然后通过授信额度模型计算用户的授信额度的技术手段,所以克服了现有技术中授信额度计算不准确的技术问题。本发明实施例通过将样本观察时点之后的贷款余额最大值标记为历史用户的授信额度,解决了授信额度模型目标变量定义模糊的问题,通过样本观察时点之后的贷款余额最大值计算历史用户合理的授信额度,为后续模型开发奠定基础,使得训练好的授信额度模型计算出合适的授信额度;而且本发明实施例进一步根据历史用户的授信额度筛选出合适的样本用户,剔除异常样本,保证整体样本的合理性。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (19)
1.一种计算授信额度的方法,其特征在于,包括:
根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度;
根据所述各个历史用户的授信额度,从所述各个历史用户中筛选出样本用户;
根据所述样本用户的用户数据训练模型,从而得到授信额度模型;
通过所述授信额度模型计算目标用户的授信额度。
2.根据权利要求1所述的方法,其特征在于,根据观察时点之后的贷款余额最大值,标记各个历史用户的授信额度,包括:
定义样本观察时点;
对于每个历史用户,计算在所述样本观察时点之后各个月的贷款余额;
对于每个历史用户,从所述各个月的贷款余额中筛选出贷款余额最大值,并将所述贷款余额最大值标记为所述历史用户的授信额度。
3.根据权利要求2所述的方法,其特征在于,计算在所述样本观察时点之后各个月的贷款余额,包括:
对于所述样本观察时点之后的每个月,所述贷款余额为所述月内各个类型的贷款的余额之和。
4.根据权利要求2所述的方法,其特征在于,定义样本观察时点,包括:
确定样本月份的数量N;其中,N大于等于6;
以距离当前时点N个月的时点作为样本观察时点。
5.根据权利要求1所述的方法,其特征在于,根据所述各个历史用户的授信额度,从所述各个历史用户中筛选出样本用户,包括:
根据授信额度的目标区间,从所述各个历史用户中筛选出待定用户,以使各个待定用户的授信额度在所述授信额度的目标区间之内;
根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户。
6.根据权利要求5所述的方法,其特征在于,根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户,包括:
根据所述各个待定用户的授信额度,计算所述授信额度的样本均值和样本标准差;
根据所述授信额度的样本均值和样本标准差,计算授信额度阈值;
从所述各个待定用户中筛选出授信额度小于等于所述授信额度阈值的样本用户。
7.根据权利要求6所述的方法,其特征在于,所述授信额度阈值采用以下公式计算:
授信额度阈值=授信额度的样本均值+W×授信额度的标准差;
其中,W大于等于2且小于等于5。
8.根据权利要求5所述的方法,其特征在于,根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户之后,还包括:
从所述样本用户中剔除贷款发生过逾期的用户。
9.一种计算授信额度的装置,其特征在于,包括:
标记模块,用于根据样本观察时点之后的贷款余额最大值,标记各个历史用户的授信额度;
筛选模块,用于根据所述各个历史用户的授信额度,从所述各个历史用户中筛选出样本用户;
训练模块,用于根据所述样本用户的用户数据训练模型,从而得到授信额度模型;
计算模块,用于通过所述授信额度模型计算目标用户的授信额度。
10.根据权利要求9所述的装置,其特征在于,所述标记模块还用于:
定义样本观察时点;
对于每个历史用户,计算在所述样本观察时点之后各个月的贷款余额;
对于每个历史用户,从所述各个月的贷款余额中筛选出贷款余额最大值,并将所述贷款余额最大值标记为所述历史用户的授信额度。
11.根据权利要求10所述的装置,其特征在于,所述标记模块还用于:
对于所述样本观察时点之后的每个月,所述贷款余额为所述月内各个类型的贷款的余额之和。
12.根据权利要求10所述的装置,其特征在于,所述标记模块还用于:
确定样本月份的数量N;其中,N大于等于6;
以距离当前时点N个月的时点作为样本观察时点。
13.根据权利要求9所述的装置,其特征在于,所述筛选模块还用于:
根据授信额度的目标区间,从所述各个历史用户中筛选出待定用户,以使各个待定用户的授信额度在所述授信额度的目标区间之内;
根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户。
14.根据权利要求13所述的装置,其特征在于,所述筛选模块还用于:
根据所述各个待定用户的授信额度,计算所述授信额度的样本均值和样本标准差;
根据所述授信额度的样本均值和样本标准差,计算授信额度阈值;
从所述各个待定用户中筛选出授信额度小于等于所述授信额度阈值的样本用户。
15.根据权利要求14所述的装置,其特征在于,所述授信额度阈值采用以下公式计算:
授信额度阈值=授信额度的样本均值+W×授信额度的标准差;
其中,W大于等于2且小于等于5。
16.根据权利要求13所述的装置,其特征在于,所述筛选模块还用于:
根据所述各个待定用户的授信额度,从所述各个待定用户中筛选出样本用户之后,从所述样本用户中剔除贷款发生过逾期的用户。
17.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
18.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8中任一所述的方法。
19.一种计算机程序产品,包括计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111413367.2A CN114092229A (zh) | 2021-11-25 | 2021-11-25 | 计算授信额度的方法、装置、电子设备和计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111413367.2A CN114092229A (zh) | 2021-11-25 | 2021-11-25 | 计算授信额度的方法、装置、电子设备和计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114092229A true CN114092229A (zh) | 2022-02-25 |
Family
ID=80304512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111413367.2A Pending CN114092229A (zh) | 2021-11-25 | 2021-11-25 | 计算授信额度的方法、装置、电子设备和计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114092229A (zh) |
-
2021
- 2021-11-25 CN CN202111413367.2A patent/CN114092229A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109460513B (zh) | 用于生成点击率预测模型的方法和装置 | |
CN107809331B (zh) | 识别异常流量的方法和装置 | |
CN112184154A (zh) | 一种业务审批方法和装置 | |
US20180018734A1 (en) | Method and system for automatically categorizing financial transaction data | |
CN112016793B (zh) | 基于目标用户群的资源分配方法、装置及电子设备 | |
CN112417060A (zh) | 识别企业关系的方法、装置、设备和计算机可读介质 | |
CN107291835B (zh) | 一种搜索词的推荐方法和装置 | |
CN111798261A (zh) | 信息更新的方法和装置 | |
CN112950359B (zh) | 一种用户识别方法和装置 | |
CN112860672A (zh) | 标签权重的确定方法和装置 | |
CN110930238A (zh) | 提高审核任务效率的方法、装置、设备和计算机可读介质 | |
CN114066603A (zh) | 贷后风险预警方法、装置、电子设备和计算机可读介质 | |
CN115719270A (zh) | 信用评价方法、装置、设备、介质和程序产品 | |
CN114092229A (zh) | 计算授信额度的方法、装置、电子设备和计算机可读介质 | |
CN110881056A (zh) | 用于推送信息的方法和装置 | |
CN111144694B (zh) | 基于触点分析的运营流程管理方法和装置 | |
CN114723455A (zh) | 业务处理方法、装置、电子设备和存储介质 | |
CN113706223A (zh) | 一种数据处理方法和装置 | |
CN113434754A (zh) | 确定推荐api服务的方法、装置、电子设备和存储介质 | |
CN111161067A (zh) | 一种交易路由的确定方法和装置 | |
CN111898027A (zh) | 确定特征维度的方法、装置、电子设备和计算机可读介质 | |
CN111178696A (zh) | 一种业务处理时长超时预警方法和装置 | |
CN112884497A (zh) | 确定用户类型的方法、装置、电子设备和存储介质 | |
CN112132722B (zh) | 政务热线数量趋势异常确定方法、装置、电子设备及介质 | |
CN110874386A (zh) | 建立类目映射关系的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |