CN106503873A - 一种预测用户守约概率的方法、装置和计算设备 - Google Patents
一种预测用户守约概率的方法、装置和计算设备 Download PDFInfo
- Publication number
- CN106503873A CN106503873A CN201611088241.1A CN201611088241A CN106503873A CN 106503873 A CN106503873 A CN 106503873A CN 201611088241 A CN201611088241 A CN 201611088241A CN 106503873 A CN106503873 A CN 106503873A
- Authority
- CN
- China
- Prior art keywords
- borrower
- risk
- new user
- loaning bill
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种预测用户守约概率的方法,适于预测借款平台的新用户在不同借款额度下的守约概率,该方法在计算设备中执行,计算设备中存储有不同借款人类别所对应的风险函数,该方法包括:获取新用户授权的数据信息;根据授权的数据信息确定新用户的特征信息;根据特征信息,采用分类器确定新用户所属的风险等级;根据特征信息和风险等级确定新用户所属的借款人类别;将借款人类别所对应的风险函数作为新用户的风险函数,根据该风险函数来确定新用户在不同借款额度下的守约概率。本发明还公开了能够实施上述方法的预测用户守约概率的装置,和包括上述装置的计算设备。
Description
技术领域
本发明涉及互联网金融服务技术领域,尤其涉及一种预测用户守约概率的方法、装置和计算设备。
背景技术
互联网金融相对于传统金融方式具有快速、高效、低成本等优点。近几年来,互联网金融行业快速发展,网络借款平台(即P2P平台)层出不穷。虽然P2P平台具有互联网金融的上述优点,但是其设立门槛低、投资风险大,每年也有相当数量的P2P平台因为坏账率过高而倒闭。因此,需要采用合理的技术手段来把控P2P平台的用户质量和资金安全,控制逾期率和坏账率,避免投资者的利益收到损害。
发明内容
为此,本发明提供一种预测用户守约概率的方法、装置和计算设备,以力图解决或至少缓解上面存在的问题。
根据本发明的一个方面,提供一种预测用户守约概率的方法,该方法适于预测借款平台的新用户在不同借款额度下的守约概率,其中,新用户为未在所述借款平台上借款的用户,该方法在计算设备中执行,该计算设备中存储有不同借款人类别所对应的风险函数,其中,一个借款人类别包括一个或多个借款人,借款人为已在所述借款平台上借款的用户,该方法包括:获取新用户授权的数据信息;根据授权的数据信息确定新用户的特征信息;根据特征信息,采用分类器确定新用户所属的风险等级;根据特征信息和风险等级确定新用户所属的借款人类别;将借款人类别所对应的风险函数作为新用户的风险函数,根据该风险函数来确定新用户在不同借款额度下的守约概率。
可选地,在根据本发明的预测用户守约概率的方法中,特征信息包括:消费情况、信用情况、通讯情况、教育情况中的一种或多种。
可选地,在根据本发明的预测用户守约概率的方法中,消费情况包括:消费总次数,平均消费金额,消费金额标准差,平均消费间隔时间,平均每笔消费中的商品数量,退款总次数,平均退款金额,以及各消费品类的消费总次数和平均消费金额中的一种或多种;信用情况包括信用消费情况和/或授信情况,其中,所述信用消费情况包括:信用时长是否达到第一时间,存在账单金额大于特定金额的月的次数,最近第一时间内的:账单总金额、平均账单金额、平均账单金额标准差、不足额还款次数、平均月账单金额占总信用额度的比例、最大月账单金额、最小月账单金额中的一种或多种;所述授信情况包括:保前审查笔数,保后管理笔数,信用卡审批笔数,贷款审批笔数,个人住房公积金贷款的:笔数、总额、余额、余额占比、逾期金额占比,个人住房贷款的:笔数、总额、余额、余额占比、逾期金额占比中的一种或多种;通讯情况包括:运营商名,号码已使用天数,是否为VIP客户,通话记录中联系人个数,通话记录中往来最频繁的多个号码的:平均通话时长、通话次数,最近第二时间内的平均月话费金额,最近第三时间内的:通话总时间、呼出通话总时间、呼入通话总时间、通话总次数、呼出通话次数、呼入通话次数、总联系人数中的一种或多种;教育情况包括:学历,毕业情况,毕业至今年限中的一种或多种。
可选地,在根据本发明的预测用户守约概率的方法中,计算设备中还存储有多个借款人的借款信息,借款信息包括还款逾期信息;分类器按照以下步骤训练:对于已有还款逾期信息的多个借款人,根据还款逾期信息分别确定每个借款人的风险等级;根据已有还款逾期信息的多个借款人的特征信息和风险等级来训练分类模型,将分类模型的训练结果作为分类器,其中,分类器的输入为借款人的特征信息,输出为借款人的风险等级。
可选地,在根据本发明的预测用户守约概率的方法中,分类模型为随机森林模型。
可选地,在根据本发明的预测用户守约概率的方法中,借款信息还包括借款金额;每个借款人类别所对应的风险函数按照以下步骤确定:根据分类器确定借款平台中每一个借款人所属的风险等级;根据各借款人的特征信息和风险等级,采用聚类算法将多个借款人聚为第一数量的借款人类别,每个借款人类别对应于一个类中心;对于每个借款人类别:确定该借款人类别所对应的风险函数所符合的概率密度分布,其中,所述风险函数的自变量为借款额度,因变量为守约概率;根据该类别所包括的多个借款人的借款金额和还款逾期信息来确定该类别的多个(借款额度,守约概率)的样本;根据所述多个样本来确定所述概率密度分布中的待定参数,从而确定所述风险函数。
可选地,在根据本发明的预测用户守约概率的方法中,聚类算法为kmeans算法。
可选地,在根据本发明的预测用户守约概率的方法中,概率密度分布为高斯分布。
可选地,在根据本发明的预测用户守约概率的方法中,根据特征信息和风险等级确定新用户所属的借款人类别的步骤包括:将特征信息和风险等级构成特征向量,计算特征向量与每一个借款人类别的类中心的相似距离;将相似距离最小的借款人类别作为该新用户所属的借款人类别。
可选地,在根据本发明的预测用户守约概率的方法中,相似距离为欧氏距离。
可选地,在根据本发明的预测用户守约概率的方法中,计算设备中还存储有黑名单,黑名单中包括一个或多个借款平台中的一个或多个黑名单借款人;该方法还包括:判断新用户是否为黑名单借款人,若是,则将该新用户的守约概率设置为0。
根据本发明的一个方面,提供一种预测用户守约概率的装置,该装置适于预测借款平台的新用户在不同借款额度下的守约概率,其中,新用户为未在所述借款平台上借款的用户,所述装置驻留于计算设备中,计算设备中存储有不同借款人类别所对应的风险函数,其中,一个借款人类别包括一个或多个借款人,借款人为已在所述借款平台上借款的用户,该装置包括:信息获取模块,适于获取新用户授权的数据信息;特征提取模块,适于根据授权的数据信息确定新用户的特征信息;风险等级确定模块,适于根据特征信息,采用分类器确定新用户所属的风险等级;个人风险函数确定模块,适于根据特征信息和风险等级确定新用户所属的借款人类别;以及将该借款人类别所对应的风险函数作为新用户的风险函数,根据该风险函数来确定新用户在不同借款额度下的守约概率。
根据本发明的一个方面,提供一种计算设备,包括如上所述的预测用户守约概率的装置。
根据本发明的技术方案,可以根据借款平台中的用户(包括已在平台上借款的用户和未在平台上借款的用户)的个人特征来确定该用户的风险函数,根据风险函数来预测用户在不同借款额度下的守约概率,从而可以实现单个用户以及整个借款平台的风险控制。
另外,本发明在确定风险函数的过程中,结合了多样的机器学习和优化方法,例如随机森林算法、kmeans算法等,使得计算结果更加准确可靠。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的网络系统100的示意图;
图2示出了根据本发明一个实施例的计算设备200的结构图;
图3示出了根据本发明一个实施例的预测用户守约概率的装置300的结构图;
图4示出了根据本发明另一个实施例的预测用户守约概率的装置300的结构图;
图5示出了根据本发明另一个实施例的预测用户守约概率的装置300的结构图;
图6示出了根据本发明一个实施例的预测用户守约概率的方法600的流程图;以及
图7示出了根据本发明另一个实施例的预测用户守约概率的方法700的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的网络系统100的示意图。图1所示的网络系统100包括计算设备200、数据库110以及多个客户端120~150。应当指出,图1中的网络系统100仅是示例性的,在具体的实践情况中,网络系统100中可以有不同数量的计算设备、数据库以及客户端,本发明对网络系统中所包括的计算设备、数据库以及客户端的数量不做限制。
计算设备200是能够管理借款平台(即P2P平台)资源并为用户提供借款服务的设备,其具体可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器和WEB服务器等,也可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。客户端120~150可以是诸如手机、平板电脑、笔记本电脑、电视盒子、可穿戴设备等可以接入互联网的设备。客户端120~150可以通过有线的方式接入互联网,也可以通过3G、4G、WiFi、个人热点、IEEE802.11x、蓝牙等无线的方式接入互联网。
用户可以经由客户端120-150登录借款平台,并向借款平台授权一部分数据源的数据信息,例如用户通讯数据、手机应用列表、网络消费数据、个人学历数据等。用户向借款平台授权某个数据源后,计算设备200可以经由互联网获取用户授权的数据,并将获取到的数据录入数据库110。应当指出,数据库110可以作为本地数据库驻留于计算设备200中,也可以作为远程数据库设置于计算设备200之外,本发明对数据库的部署方式不做限制。
根据一种实施例,计算设备200中驻留有数据处理装置,该装置适于对获取到的数据进行清洗。例如,在授权了某个数据源的所有用户中,若该数据源的某个数据项有80%以上的用户都缺失,则基于该数据项的后续分析不具有普遍意义,因而在数据库中删除该数据项。一个具体的例子是,共有5000个用户授权了学历数据,而仅有500个用户提供的信息中有“毕业至今年限”的信息,即计算设备200仅能获取500个“毕业至今年限”信息,缺失“毕业至今年限”这一数据项的用户占所有授权用户的90%(>80%),故删除“毕业至今年限”这一数据项。
图2示出了根据本发明一个实施例的计算设备200的结构图。在基本配置202中,计算设备200典型地包括系统存储器206和一个或者多个处理器204。系统存储器206可以包括操作系统220、一个或者多个应用222以及程序数据226,应用222可以布置为在操作系统上利用程序数据226进行操作。
在本发明中,计算设备200的应用222中包括预测用户守约概率的装置300。装置300可以作为搜索引擎的一个插件驻留于计算设备200的浏览器中,或作为一个独立的软件安装于计算设备200中,本发明对装置300在计算设备200中的存在形式不做限制。装置300适于预测借款平台的新用户在不同借款额度下的守约概率,其中,新用户指的是未在该借款平台上借款的用户。程序数据226中包括不同借款人类别所对应的风险函数,其中,一个借款人类别包括一个或多个借款人,借款人为已在该借款平台上借款的用户。装置300可以获取新用户授权的数据信息,并从中提取出新用户的特征信息,根据新用户的特征信息依次确定新用户所属的风险等级和借款人类别,从程序数据226中获取该借款人类别所对应的风险函数作为新用户的风险函数,根据风险函数来确定用户在不同借款额度下的守约概率,从而实现对用户以及整个借款平台的风险控制。
图3示出了根据本发明一个实施例的预测用户守约概率的装置300的结构图。如图3所示,预测用户守约概率的装置300包括信息获取模块310、特征提取模块320、风险等级确定模块330以及个人风险函数确定模块340,其中,风险等级确定模块330包括分类器332。
信息提取模块310适于从数据库110中获取新用户授权的数据信息。用户授权的数据信息包括但不限于以下几种:
1、个人基本信息:包括年龄、性别、身份证号等;
2、通讯数据:包括本机号码、通讯录、通话记录等;
3、学历数据:包括毕业院校、专业、毕业至今年限等;
4、个人信用消费数据:包括交易时间、账单金额、信用额度、信用剩余额度等;
5、授信记录:包括信用卡申请记录、贷款种类、贷款总额、贷款余额等;
6、网络消费交易信息:包括网络电商平台的会员等级、消费记录、退款记录等。
7、网络社交平台信息:包括帐号等级、帐号登录时间等。
信息提取模块310获取了用户授权的数据信息后,特征提取模块320根据用户授权的数据信息来确定新用户的特征信息。根据一种实施例,特征信息包括消费情况、信用情况、通讯情况、教育情况中的一种或多种。当然,除上述四种信息之外,特征信息中还可以包括其他信息,本发明对特征信息中所包括的具体的信息项目不做限制。
根据一种实施例,消费情况可以是从用户授权的电商平台的在线交易信息中所提取出来的信息。消费情况包括但不限于以下信息项目:消费总次数,平均消费金额,消费金额标准差,平均消费间隔时间,平均每笔消费中的商品数量,退款总次数,平均退款金额,以及各消费品类的消费总次数和平均消费金额。
根据一种实施例,信用情况包括信用消费情况和/或授信情况。信用消费情况包括但不限于以下信息项目:信用时长是否达到第一时间,存在账单金额大于特定金额的月的次数,最近第一时间内的:账单总金额、平均账单金额、平均账单金额标准差、不足额还款次数、平均月账单金额占总信用额度的比例、最大月账单金额、最小月账单金额。其中,第一时间、特定金额可以由本领域技术人员自行设置,例如,第一时间可以是6个月,特定金额可以是10000元。
授信情况包括但不限于以下信息项目:保前审查笔数,保后管理笔数,信用卡审批笔数,贷款审批笔数,个人住房公积金贷款的:笔数、总额、余额、余额占比、逾期金额占比,个人住房贷款的:笔数、总额、余额、余额占比、逾期金额占比。
根据一种实施例,通讯情况可以是从用户授权的通讯数据中提取出来的信息。通讯情况包括但不限于以下信息项目:运营商名,号码已使用天数,是否为VIP客户,通话记录中联系人个数,通话记录中往来最频繁的多个号码的:平均通话时长、通话次数,最近第二时间内的平均月话费金额,最近第三时间内的:通话总时间、呼出通话总时间、呼入通话总时间、通话总次数、呼出通话次数、呼入通话次数、总联系人数。其中,第二时间、第三时间可以由本领域技术人员自行设置,例如,第二时间可以是3个月,第三时间可以是1个月。
根据一种实施例,教育情况可以是从用户授权的学历数据中提取出来的信息。教育情况包括但不限于以下信息项目:学历,毕业情况(在校/毕业/肄业),毕业至今年限。
应当指出,上述某些信息项目的取值可能因为用户未设置或未授权而为空(null),此外,特征提取模块320在提取特征信息的过程中也可能会出现网络故障以及其他错误,使得某些信息项目可能会出现缺失值的情况。这时,根据一种实施例,特征提取模块320可以采用一定的算法、规则对缺失值进行填充。例如,对于取值为连续型的信息项目,可以采用均值填充的思想,例如,消费情况中的“平均消费金额”的值缺失,则特征提取模块320可以根据用户的会员等级,用其会员等级的平均消费金额的均值来填充缺失的“平均消费金额”信息项目。又例如,对于取值为离散型的信息项目,可以用“未知”或“未授权”来填充其取值。
特征提取模块320确定了新用户的特征信息后,将特征信息传递至风险等级确定模块330,由分类器332根据该特征信息来确定新用户所属的风险等级。
分类器332可以是一个由本领域技术人员自行设置的固定的分类器,也可以是一个根据多个已知的形如(特征信息,风险等级)的样本所训练出来的分类器。根据一种实施例,如图4所示,装置300还包括分类器训练模块350,适于训练分类器332。根据一种实施例,分类器训练模块350可以按照以下步骤训练分类器332:
1、对于已有还款逾期信息(计算设备中存储有多个借款人的借款信息,借款信息包括借款金额、还款逾期信息等)的多个借款人,根据还款逾期信息分别确定每个借款人的风险等级。还款逾期指的是借款人的还款日期超出借款合同约定的还款日期的天数,若借款人按期还款,则该借款人的还款逾期为0。例如,根据还款逾期信息将借款人划分为低风险、中等风险、高风险三个等级,还款逾期在7天以内的为低风险,还款逾期在7~90天的为中等风险,还款逾期大于90天的为高风险。当然,上述风险等级的确定方式仅是示例性的,本领域技术人员也可以依据实际情况设置其他的风险等级确定方式,本发明对此并无限制。
2、根据已有还款逾期信息的多个借款人的特征信息和风险等级来训练分类模型,将分类模型的训练结果作为分类器,其中,分类器的输入为借款人的特征信息,输出为借款人的风险等级。
根据一种实施例,分类模型为随机森林模型,根据已知的多个(特征信息,风险等级)样本来训练该随机森林模型,该模型的输入为特征信息,预测目标为风险等级。应当指出,在训练随机森林模型时,需要设置多项参数,例如随机森林的棵数、深度、抽取的样本数量等,不同的参数组合下的随机森林模型的分类准确率会有区别。因此,在实际训练过程中,可以设置多组参数,采用K折交叉验证法(K-CV,K-fold Cross Validation)来评价每一组参数下的分类模型的准确性,找出准确性最优的一组参数,将该组参数下的分类模型作为最终的分类器。根据一种实施例,上述K折交叉验证中的K可以设置为5。当然,本领域技术人员也可以将K设置为其他数值,本发明对此不做限制。
当然,除了随机森林模型之外,分类模型也可以为其他模型,例如CART树、C4.5决策树,等等,本发明对分类模型的具体形式不做限制。但是,应当指出,随机森林模型相对于其他分类模型还存在一个优点,即随机森林模型除了能够实现分类,还可以计算出每个特征信息项的重要性。这样,基于随机森林模型的分析结果,可以从多个特征信息项中选出最重要的几项进行后续分析,从而抛弃冗余的或所含信息量小的特征信息项,相当于实现了特征信息的降维,提高了数据分析的针对性和计算速度,这在特征信息所包含的信息项目很多(特征信息项有时可以多达几百甚至上千个)时尤有必要。
应当指出,根据另一种实施例,分类器训练模块350也可以设置于装置300之外,如图4中的虚线框所示,其功能与处理逻辑与前述设置于装置300之内时的情况相同。
基于本领域技术人员自行设置的或由分类器训练模块350训练得出的分类器332,风险等级确定模块330可以确定新用户所属的风险等级。确定新用户所属的风险等级相当于从特征信息所包含的多个特征信息项中提取关键信息,有助于提高后续确定新用户所属的借款人类别的精度。
风险等级确定模块330确定了新用户所属的风险等级后,个人风险函数确定模块340适于根据特征信息和风险等级来确定新用户所属的借款人类别,并将该借款人类别所对应的风险函数作为新用户的风险函数,从而根据该风险函数来确定新用户在不同借款额度下的守约概率。
风险函数是一个形如P=f(x|θ)的函数,其中,自变量x为借款额度,因变量P为守约概率,θ为常量参数。确定P=f(x|θ)的过程实际上就是求出该函数中的常量参数θ的过程。为了求取函数中的参数θ,需要获取多个(x,P)样本,即获取借款人在多个借款额度下的守约概率,从而可以绘制该借款人的风险函数分布曲线,确定风险函数中的常量参数θ。然而,单个借款人在借款平台上的借款次数往往是有限的,因此,我们很难得到单个借款人在多个借款额度下的守约概率。考虑到虽然借款平台上有大量的借款人、每个借款人各有特点,但是多个借款人之间也可能存在一些共性,使得某些借款人会出现类似的借款行为。因此,一种可能的解决方法是,首先对平台中的借款人进行聚类,每一类借款人的特性相似,他们共用一个风险函数。在对借款人进行聚类后,可以得出每一个类别的借款人的多个(x,P)样本,基于这些样本,可以求得风险函数中的常量参数θ,从而确定风险函数。
根据一种实施例,如图4所示,装置300中还包括类别风险函数确定模块360,适于按照以下步骤确定每个借款人类别所对应的风险函数:
1、采用分类器332确定借款平台中每一个借款人所属的风险等级。这样,借款平台中的每一个借款人都对应于一个[特征信息,风险等级]向量。
2、根据各借款人的特征信息和风险等级,采用聚类算法将多个借款人聚为第一数量的借款人类别,每个借款人类别对应于一个类中心。由于每个借款人都由一个[特征信息,风险等级]向量来表示,故在聚类结果中,类中心也体现为一个[特征信息,风险等级]向量。
根据一种实施例,上述聚类算法为kmeans算法,第一数量为N/500,其中,N为借款平台上所包括的借款人的总数量。当然,在其他的实施例中,也可以将第一数量设置为其他数值,本发明对此并无限制。但是应当注意,第一数量应当能保证每个类别的借款人数不会太少,从而使得每一类别的(x,P)样本基本无偏;同时,第一数量应当也能保证每个类别的借款人数不会太多,若每个类别的借款人数太多,则会使得借款人类别的划分粒度太粗糙,不能更精确地描述每一类借款人的特点,从而降低了风险函数的准确性。
当然,除了kmeans算法之外,也可以采用其他的算法来对借款平台中的借款人进行分类,例如DBSCAN聚类算法、支持向量机等,本发明对聚类算法不做限制。
3、确定每个借款人类别所对应的风险函数。
对于每个借款人类别:
1)首先确定该借款人类别所对应的风险函数所符合的概率密度分布,其中,所述风险函数的自变量为借款额度,因变量为守约概率,即,P=f(x|θ)。
考虑到实际情况中守约概率和借款额度的关系,很低的授权借款额度可能是由于借款人的风险程度很高,相应地其守约概率会较低。此外,过高的授权借款额度可能来自于欺诈行为,即使不是欺诈行为,过高的借款额度也可能导致借款人由于还款能力有限而违约。因此,概率密度分布可能是一个两头低、中间高的钟形曲线。例如,根据一种实施例,概率密度分布可以是高斯分布:
其中,μ、δ为待定的常量参数。
当然,除高斯分布之外,概率密度分布也可以是其他分布,例如t分布、F分布、卡方分布等等,本发明对概率密度分布的具体形式不做限制。
2)根据该类别所包括的多个借款人的借款金额和还款逾期信息来确定该类别的多个(借款额度,守约概率)的样本。例如,某个借款人类别包括500个借款人,其中,有400人拥有借款金额为200的借款记录,在这400人当中,有300人按期还款(即还款逾期=0),则借款额度200的守约概率为300/400=0.75,即P(x=200)=0.75,这样就可以得到一个(x,P)样本:(200,0.75)。同理,可以继续得到多个(x,P)样本。
3)根据多个样本来确定概率密度分布中的待定参数,从而确定所述风险函数。
待定参数的求解方式有多种,例如多元线性回归、极大似然估计、神经网络估计等等,本发明对待定参数的求解方式不做限制。根据一种实施例,可以采用极大似然法来估计待定参数。特别地,对于上述式(1)所示的高斯分布,极大似然法的参数估计等价于以下公式:
其中,n为该借款人类别中所包括的(x,P)样本的数量。
应当指出,根据另一种实施例,类别风险函数确定模块360也可以设置于装置300之外,如图4中的虚线框所示,其功能与处理逻辑与前述设置于装置300之内时的情况相同。
基于类别风险函数确定模块360所确定的各借款人类别所对应的风险函数,个人风险函数确定模块340通过确定新用户所述的借款人类别即可以确定该新用户所对应的风险函数。根据一种实施例,个人风险函数确定模块340首先将新用户的特征信息和风险等级构成形如[特征信息,风险等级]的特征向量,随后计算该特征向量与每一个借款人类别的类中心的相似距离,并将相似距离最小的借款人类别作为该新用户所属的借款人类别,该借款人类别所对应的风险函数即为该新用户的风险函数。根据一种实施例,相似距离为欧氏距离,向量x=[x1,x2,…,xm]和向量y=[y1,y2,…,ym]的欧氏距离为当然,相似距离也可以为其他距离,例如夹角余弦、曼哈顿距离、切比雪夫距离等等,本发明对此不做限制。
个人风险函数确定模块340确定了新用户的风险函数后,借款平台即可以实现对该用户的风险控制。例如,若平台想要将该用户的违约率控制在5%以内,则需要根据该用户的风险函数计算出守约概率为95%以上时所对应的借款额度范围,将用户的借款金额控制在该借款额度范围内,即可实现将该用户违约率控制在5%以内的风控目标。
此外,尽管以上从确定一个新用户的风险函数的角度描述了装置300,但是本领域技术人员应当理解,装置300不仅可以确定一个用户的风险函数,而是可以确定借款平台中所有用户(包括新用户和借款人)的风险函数。在所有用户的风险函数可知的情况下,也可以实现对整个借款平台的风险控制。例如,平台想要将整体的违约率控制在3%以下,则可以通过各用户的风险函数计算出守约概率为97%以上时各用户的借款额度范围,将各用户的借款金额控制在其借款额度范围内,即可以实现平台整体违约率为3%以内的风控目标。又例如,平台想要控制高风险用户的风险水平,同时适当放宽对低风险用户的风险容忍度,则可以缩减高风险用户的借款额度,并适当增加低风险用户的借款额度。总之,根据本发明,可以方便地实现对单个用户以及整个借款平台的风险控制。
图5示出了根据本发明另一个实施例的预测用户守约概率的装置300的结构图。图5中所示的信息获取模块310、特征提取模块320、风险等级确定模块330、分类器332、个人风险函数确定模块340、分类器训练模块350以及类别风险函数确定模块360的功能和处理逻辑与图3、图4中所示的相同,此处不再赘述。
图5所示的装置300还包括黑名单过滤模块370。根据一种实施例,计算设备200中还设有用于与其他借款平台进行通信的接口,经由该接口,计算设备200可以获取其他借款平台的黑名单信息,并将其存储于计算设备200的数据库中。黑名单中包括一个或多个黑名单借款人,黑名单借款人的信用极低,通常有借无还。每个借款平台都有一套用于判定黑名单借款人的方法,例如,可以将违约金额大于5000元的用户标记为黑名单借款人。
当信息获取模块310获取了新用户授权的数据信息后,黑名单过滤模块370可以从该新用户授权的数据信息中提取出能够用于唯一标识该用户的信息,例如手机号、身份证号、QQ号等,并通过该标识信息在黑名单中查找,判断该新用户是否为黑名单借款人。若该新用户为黑名单借款人,则直接将该新用户的守约概率设置为0,不再计算其风险函数。
图6示出了根据本发明一个实施例的预测用户守约概率的方法600的流程图,该方法适于在前述图3、图4所示的预测用户守约概率的装置300中执行。如图6所示,该方法始于步骤S610。
在步骤S610中,获取新用户授权的数据信息。步骤S610的具体过程可以参考前述对信息提取模块310的描述,此处不再赘述。
随后,在步骤S620中,根据授权的数据信息确定新用户的特征信息。特征信息中所包括的信息项目可以参考前述对特征提取模块320的描述,此处不再赘述。
随后,在步骤S630中,根据特征信息,采用分类器确定新用户所属的风险等级。根据一种实施例,分类器可以是根据多个已知的形如(特征信息,风险等级)的样本训练得出。步骤S630、以及分类器的训练过程可以分别参考前述对特征提取模块320、分类器训练模块350的描述,此处不再赘述。
随后,在步骤S640中,根据特征信息和风险等级确定新用户所属的借款人类别。根据一种实施例,采用kmeans聚类算法将借款平台的借款人聚为多个借款人类别,每个借款人类别对应于一个类中心。将新用户的特征信息和风险等级构成特征向量,计算该特征向量与每一个借款人类别的类中心的相似距离,并将相似距离最小的借款人类别作为该新用户所属的借款人类别。步骤S640的具体过程可以参考前述对个人风险函数确定模块340的描述,此处不再赘述。
随后,在步骤S650中,将借款人类别所对应的风险函数作为新用户的风险函数,根据风险函数来确定新用户在不同借款额度下的守约概率。
根据一种实施例,借款人类别所对应的风险函数可以由该借款人类别中的多个形如(借款额度,守约概率)的样本来确定。确定各借款人类别所对应的风险函数的具体步骤可以参考前述对类别风险函数确定模块360的描述,此处不再赘述。
图7示出了根据本发明另一个实施例的预测用户守约概率的方法700的流程图,该方法适于在前述图5所示的预测用户守约概率的装置300中执行。方法700的步骤S710、S740~S770分别与方法600中的步骤S610~S650一一对应,此处不再赘述。方法700与方法600的区别在于步骤S720和S730。
在步骤S720中,根据新用户授权的数据信息判断新用户是否为黑名单借款人,若是,则执行步骤S730,将该新用户的守约概率设置为0;若否,则继续顺序执行步骤S740~S770,确定该新用户的风险函数。步骤S720和S730的详细过程可以参考前述对黑名单过滤模块370的描述。
A6:A5所述的方法,其中,所述聚类算法为kmeans算法。A7:A5所述的方法,其中,所述概率密度分布为高斯分布。A8:A5所述的方法,其中,根据所述特征信息和所述风险等级确定新用户所属的借款人类别的步骤包括:将所述特征信息和所述风险等级构成特征向量,计算所述特征向量与每一个借款人类别的类中心的相似距离;将相似距离最小的借款人类别作为该新用户所属的借款人类别。A9:A8所述的方法,其中,所述相似距离为欧氏距离。A10:A1所述的方法,其中,所述计算设备中还存储有黑名单,所述黑名单中包括一个或多个借款平台中的一个或多个黑名单借款人;所述方法还包括:判断新用户是否为黑名单借款人,若是,则将该新用户的守约概率设置为0。
B15:B13所述的装置,其中,所述借款信息还包括借款金额;所述装置还包括类别风险函数确定模块,适于按照以下步骤确定每个借款人类别所对应的风险函数:根据所述分类器确定借款平台中每一个借款人所属的风险等级;根据各借款人的特征信息和风险等级,采用聚类算法将多个借款人聚为第一数量的借款人类别,每个借款人类别对应于一个类中心;对于每个借款人类别:确定该借款人类别所对应的风险函数所符合的概率密度分布,其中,所述风险函数的自变量为借款额度,因变量为守约概率;根据该类别所包括的多个借款人的借款金额和还款逾期信息来确定该类别的多个(借款额度,守约概率)的样本;根据所述多个样本来确定所述概率密度分布中的待定参数,从而确定所述风险函数。B16:B15所述的装置,其中,所述聚类算法为kmeans算法。B17:B15所述的装置,其中,所述概率密度分布为高斯分布。B18:B15所述的装置,其中,所述个人风险函数确定模块进一步适于按照以下步骤确定新用户所属的借款人类别:将所述特征信息和所述风险等级构成特征向量,计算所述特征向量与每一个借款人类别的类中心的相似距离;将相似距离最小的借款人类别作为该新用户所属的借款人类别。B19:B18所述的装置,其中,所述相似距离为欧氏距离。B20:B11所述的装置,其中,所述计算设备中还存储有黑名单,所述黑名单中包括一个或多个借款平台中的一个或多个黑名单借款人;所述装置还包括黑名单过滤模块,适于判断新用户是否为黑名单借款人,若是,则将该新用户的守约概率设置为0。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (10)
1.一种预测用户守约概率的方法,适于预测借款平台的新用户在不同借款额度下的守约概率,其中,所述新用户为未在所述借款平台上借款的用户,所述方法在计算设备中执行,所述计算设备中存储有不同借款人类别所对应的风险函数,其中,一个借款人类别包括一个或多个借款人,所述借款人为已在所述借款平台上借款的用户,所述方法包括:
获取新用户授权的数据信息;
根据所述授权的数据信息确定新用户的特征信息;
根据所述特征信息,采用分类器确定新用户所属的风险等级;
根据所述特征信息和所述风险等级确定新用户所属的借款人类别;
将所述借款人类别所对应的风险函数作为新用户的风险函数,根据所述风险函数来确定新用户在不同借款额度下的守约概率。
2.如权利要求1所述的方法,其中,所述特征信息包括:消费情况、信用情况、通讯情况、教育情况中的一种或多种。
3.如权利要求1所述的方法,其中,所述计算设备中还存储有多个借款人的借款信息,所述借款信息包括还款逾期信息;
所述分类器按照以下步骤训练:
对于已有还款逾期信息的多个借款人,根据还款逾期信息分别确定每个借款人的风险等级;
根据已有还款逾期信息的多个借款人的特征信息和风险等级来训练分类模型,将分类模型的训练结果作为分类器,其中,所述分类器的输入为借款人的特征信息,输出为借款人的风险等级。
4.如权利要求3所述的方法,其中,所述分类模型为随机森林模型。
5.如权利要求3所述的方法,其中,所述借款信息还包括借款金额;
每个借款人类别所对应的风险函数按照以下步骤确定:
根据所述分类器确定借款平台中每一个借款人所属的风险等级;
根据各借款人的特征信息和风险等级,采用聚类算法将多个借款人聚为第一数量的借款人类别,每个借款人类别对应于一个类中心;
对于每个借款人类别:
确定该借款人类别所对应的风险函数所符合的概率密度分布,其中,所述风险函数的自变量为借款额度,因变量为守约概率;
根据该类别所包括的多个借款人的借款金额和还款逾期信息来确定该类别的多个(借款额度,守约概率)的样本;
根据所述多个样本来确定所述概率密度分布中的待定参数,从而确定所述风险函数。
6.一种预测用户守约概率的装置,适于预测借款平台的新用户在不同借款额度下的守约概率,其中,所述新用户为未在所述借款平台上借款的用户,所述装置驻留于计算设备中,所述计算设备中存储有不同借款人类别所对应的风险函数,其中,一个借款人类别包括一个或多个借款人,所述借款人为已在所述借款平台上借款的用户,所述装置包括:
信息获取模块,适于获取新用户授权的数据信息;
特征提取模块,适于根据所述授权的数据信息确定新用户的特征信息;
风险等级确定模块,适于根据所述特征信息,采用分类器确定新用户所属的风险等级;
个人风险函数确定模块,适于根据所述特征信息和所述风险等级确定新用户所属的借款人类别;以及将所述借款人类别所对应的风险函数作为新用户的风险函数,根据所述风险函数来确定新用户在不同借款额度下的守约概率。
7.如权利要求6所述的装置,其中,所述特征信息包括:消费情况、信用情况、通讯情况、教育情况中的一种或多种。
8.如权利要求6所述的装置,其中,所述计算设备中还存储有多个借款人的借款信息,所述借款信息包括还款逾期信息;
所述装置还包括分类器训练模块,适于按照以下步骤训练所述分类器:
对于已有还款逾期信息的多个借款人,根据还款逾期信息分别确定每个借款人的风险等级;
根据已有还款逾期信息的多个借款人的特征信息和风险等级来训练分类模型,将分类模型的训练结果作为分类器,其中,所述分类器的输入为借款人的特征信息,输出为借款人的风险等级。
9.如权利要求8所述的装置,其中,所述分类模型为随机森林模型。
10.一种计算设备,包括如权利要求6-9中任一项所述的预测用户守约概率的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611088241.1A CN106503873A (zh) | 2016-11-30 | 2016-11-30 | 一种预测用户守约概率的方法、装置和计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611088241.1A CN106503873A (zh) | 2016-11-30 | 2016-11-30 | 一种预测用户守约概率的方法、装置和计算设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106503873A true CN106503873A (zh) | 2017-03-15 |
Family
ID=58329321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611088241.1A Pending CN106503873A (zh) | 2016-11-30 | 2016-11-30 | 一种预测用户守约概率的方法、装置和计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106503873A (zh) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107346515A (zh) * | 2017-06-01 | 2017-11-14 | 银联智策顾问(上海)有限公司 | 一种信用卡账户分期预测方法及装置 |
CN107679829A (zh) * | 2017-09-26 | 2018-02-09 | 长沙裕邦软件开发有限公司 | 一种自动在线债权管理实现方法、设备及存储器 |
CN107798597A (zh) * | 2017-10-09 | 2018-03-13 | 上海二三四五金融科技有限公司 | 一种动态高风险客群检测方法及系统 |
CN108256995A (zh) * | 2018-01-09 | 2018-07-06 | 秒钱(北京)信息服务有限公司 | 一种基于连接函数的还款意愿预测方法及系统 |
CN108389125A (zh) * | 2018-02-27 | 2018-08-10 | 挖财网络技术有限公司 | 信贷申请的逾期风险预测方法及装置 |
CN108416664A (zh) * | 2018-01-29 | 2018-08-17 | 广州越秀金融科技有限公司 | 基于消费信贷场景的风险评估方法及系统实现 |
CN108537460A (zh) * | 2018-04-18 | 2018-09-14 | 上海融之家金融信息服务有限公司 | 用户风险预测方法及系统 |
CN108776791A (zh) * | 2018-06-07 | 2018-11-09 | 中国平安人寿保险股份有限公司 | 客户身份识别校验方法、装置、计算机设备和存储介质 |
CN108846743A (zh) * | 2018-06-12 | 2018-11-20 | 北京京东金融科技控股有限公司 | 用于生成信息的方法和装置 |
CN108846520A (zh) * | 2018-06-22 | 2018-11-20 | 北京京东金融科技控股有限公司 | 贷款逾期预测方法、装置以及计算机可读存储介质 |
CN109064032A (zh) * | 2018-08-06 | 2018-12-21 | 国网浙江杭州市临安区供电有限公司 | 基于企业云平台的供电所小微权力廉洁风险监督管控系统 |
CN109146661A (zh) * | 2018-07-04 | 2019-01-04 | 深圳市买买提信息科技有限公司 | 用户类型预测方法、装置、电子设备及存储介质 |
CN109146122A (zh) * | 2018-06-27 | 2019-01-04 | 深圳市买买提信息科技有限公司 | 一种概率预测方法、装置、电子设备及计算机存储介质 |
CN109165840A (zh) * | 2018-08-20 | 2019-01-08 | 平安科技(深圳)有限公司 | 风险预测处理方法、装置、计算机设备和介质 |
CN109255698A (zh) * | 2018-08-20 | 2019-01-22 | 平安普惠企业管理有限公司 | 基于大数据的还款额的分配方法及终端设备 |
WO2019061989A1 (zh) * | 2017-09-30 | 2019-04-04 | 平安科技(深圳)有限公司 | 贷款风险控制方法、电子装置及可读存储介质 |
CN109636482A (zh) * | 2018-12-21 | 2019-04-16 | 苏宁易购集团股份有限公司 | 基于相似度模型的数据处理方法及系统 |
CN109993652A (zh) * | 2019-02-20 | 2019-07-09 | 复旦大学 | 一种借贷信用风险评估方法及装置 |
CN110046229A (zh) * | 2019-04-18 | 2019-07-23 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN110134948A (zh) * | 2019-04-23 | 2019-08-16 | 北京淇瑀信息科技有限公司 | 一种基于文本数据的金融风险控制方法、装置和电子设备 |
CN110619434A (zh) * | 2019-09-17 | 2019-12-27 | 北谷电子有限公司上海分公司 | 一种预测还款概率的方法、装置、电子设备和存储介质 |
CN111178679A (zh) * | 2019-12-06 | 2020-05-19 | 中能瑞通(北京)科技有限公司 | 一种基于聚类算法和网络搜索的相位识别方法 |
CN111210109A (zh) * | 2019-12-20 | 2020-05-29 | 上海淇玥信息技术有限公司 | 基于关联用户预测用户风险的方法、装置和电子设备 |
CN112330047A (zh) * | 2020-11-18 | 2021-02-05 | 交通银行股份有限公司 | 一种基于用户行为特征的信用卡还款概率预测方法 |
CN112529303A (zh) * | 2020-12-15 | 2021-03-19 | 建信金融科技有限责任公司 | 基于模糊决策的风险预测方法、装置、设备和存储介质 |
CN113313570A (zh) * | 2021-05-25 | 2021-08-27 | 深圳前海微众银行股份有限公司 | 违约率确定方法、系统、计算机程序产品及存储介质 |
CN113850663A (zh) * | 2021-08-24 | 2021-12-28 | 江苏中交车旺科技有限公司 | 一种面向新用户推荐的数据处理方法、系统、设备及介质 |
-
2016
- 2016-11-30 CN CN201611088241.1A patent/CN106503873A/zh active Pending
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107346515A (zh) * | 2017-06-01 | 2017-11-14 | 银联智策顾问(上海)有限公司 | 一种信用卡账户分期预测方法及装置 |
CN107679829A (zh) * | 2017-09-26 | 2018-02-09 | 长沙裕邦软件开发有限公司 | 一种自动在线债权管理实现方法、设备及存储器 |
WO2019061989A1 (zh) * | 2017-09-30 | 2019-04-04 | 平安科技(深圳)有限公司 | 贷款风险控制方法、电子装置及可读存储介质 |
CN107798597A (zh) * | 2017-10-09 | 2018-03-13 | 上海二三四五金融科技有限公司 | 一种动态高风险客群检测方法及系统 |
CN108256995A (zh) * | 2018-01-09 | 2018-07-06 | 秒钱(北京)信息服务有限公司 | 一种基于连接函数的还款意愿预测方法及系统 |
CN108416664A (zh) * | 2018-01-29 | 2018-08-17 | 广州越秀金融科技有限公司 | 基于消费信贷场景的风险评估方法及系统实现 |
CN108389125A (zh) * | 2018-02-27 | 2018-08-10 | 挖财网络技术有限公司 | 信贷申请的逾期风险预测方法及装置 |
CN108537460A (zh) * | 2018-04-18 | 2018-09-14 | 上海融之家金融信息服务有限公司 | 用户风险预测方法及系统 |
CN108776791A (zh) * | 2018-06-07 | 2018-11-09 | 中国平安人寿保险股份有限公司 | 客户身份识别校验方法、装置、计算机设备和存储介质 |
CN108846743A (zh) * | 2018-06-12 | 2018-11-20 | 北京京东金融科技控股有限公司 | 用于生成信息的方法和装置 |
CN108846520A (zh) * | 2018-06-22 | 2018-11-20 | 北京京东金融科技控股有限公司 | 贷款逾期预测方法、装置以及计算机可读存储介质 |
CN109146122A (zh) * | 2018-06-27 | 2019-01-04 | 深圳市买买提信息科技有限公司 | 一种概率预测方法、装置、电子设备及计算机存储介质 |
CN109146661A (zh) * | 2018-07-04 | 2019-01-04 | 深圳市买买提信息科技有限公司 | 用户类型预测方法、装置、电子设备及存储介质 |
CN109064032A (zh) * | 2018-08-06 | 2018-12-21 | 国网浙江杭州市临安区供电有限公司 | 基于企业云平台的供电所小微权力廉洁风险监督管控系统 |
CN109165840A (zh) * | 2018-08-20 | 2019-01-08 | 平安科技(深圳)有限公司 | 风险预测处理方法、装置、计算机设备和介质 |
CN109255698A (zh) * | 2018-08-20 | 2019-01-22 | 平安普惠企业管理有限公司 | 基于大数据的还款额的分配方法及终端设备 |
CN109165840B (zh) * | 2018-08-20 | 2022-06-21 | 平安科技(深圳)有限公司 | 风险预测处理方法、装置、计算机设备和介质 |
CN109255698B (zh) * | 2018-08-20 | 2024-03-22 | 武汉安辰鑫信息科技有限公司 | 基于大数据的还款额的分配方法及终端设备 |
CN109636482A (zh) * | 2018-12-21 | 2019-04-16 | 苏宁易购集团股份有限公司 | 基于相似度模型的数据处理方法及系统 |
CN109636482B (zh) * | 2018-12-21 | 2021-07-27 | 南京星云数字技术有限公司 | 基于相似度模型的数据处理方法及系统 |
CN109993652A (zh) * | 2019-02-20 | 2019-07-09 | 复旦大学 | 一种借贷信用风险评估方法及装置 |
CN109993652B (zh) * | 2019-02-20 | 2024-02-06 | 复旦大学 | 一种借贷信用风险评估方法及装置 |
CN110046229A (zh) * | 2019-04-18 | 2019-07-23 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN110134948A (zh) * | 2019-04-23 | 2019-08-16 | 北京淇瑀信息科技有限公司 | 一种基于文本数据的金融风险控制方法、装置和电子设备 |
CN110619434A (zh) * | 2019-09-17 | 2019-12-27 | 北谷电子有限公司上海分公司 | 一种预测还款概率的方法、装置、电子设备和存储介质 |
CN111178679A (zh) * | 2019-12-06 | 2020-05-19 | 中能瑞通(北京)科技有限公司 | 一种基于聚类算法和网络搜索的相位识别方法 |
CN111210109A (zh) * | 2019-12-20 | 2020-05-29 | 上海淇玥信息技术有限公司 | 基于关联用户预测用户风险的方法、装置和电子设备 |
CN112330047A (zh) * | 2020-11-18 | 2021-02-05 | 交通银行股份有限公司 | 一种基于用户行为特征的信用卡还款概率预测方法 |
CN112529303A (zh) * | 2020-12-15 | 2021-03-19 | 建信金融科技有限责任公司 | 基于模糊决策的风险预测方法、装置、设备和存储介质 |
CN113313570A (zh) * | 2021-05-25 | 2021-08-27 | 深圳前海微众银行股份有限公司 | 违约率确定方法、系统、计算机程序产品及存储介质 |
CN113313570B (zh) * | 2021-05-25 | 2024-05-10 | 深圳前海微众银行股份有限公司 | 违约率确定方法、系统、计算机程序产品及存储介质 |
CN113850663A (zh) * | 2021-08-24 | 2021-12-28 | 江苏中交车旺科技有限公司 | 一种面向新用户推荐的数据处理方法、系统、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106503873A (zh) | 一种预测用户守约概率的方法、装置和计算设备 | |
CN109389486A (zh) | 贷款风控规则调整方法、装置、设备及计算机存储介质 | |
CN110992169A (zh) | 一种风险评估方法、装置、服务器及存储介质 | |
CN109214436A (zh) | 一种针对目标场景的预测模型训练方法及装置 | |
CN106447434A (zh) | 个人信用生态平台 | |
CN109146662A (zh) | 一种风险控制方法及装置 | |
CN105512938A (zh) | 一种基于用户长期使用行为的在线信用风险评估方法 | |
US20210357679A1 (en) | Clustering techniques for machine learning models | |
CN108961032A (zh) | 借贷处理方法、装置以及服务器 | |
JP6713238B2 (ja) | 電子装置、小売店舗評価モデルを構築する方法、システム及び記憶媒体 | |
CN109325845A (zh) | 一种金融产品智能推荐方法及系统 | |
CN108062674A (zh) | 基于gps的订单欺诈识别方法、系统、存储介质和电子设备 | |
WO2020261074A1 (es) | Sistema y método para la aprobación y desembolso de un crédito | |
CN109685643A (zh) | 贷款审核中风险等级确定方法、装置、设备及存储介质 | |
CN112116103A (zh) | 基于联邦学习的个人资质评估方法、装置及系统及存储介质 | |
CN110097450A (zh) | 车贷风险评估方法、装置、设备和存储介质 | |
CN109800363A (zh) | 构建资信关系网络的方法、装置、设备及存储介质 | |
CN109598542A (zh) | 一种营销权益的投放方法、装置及电子设备 | |
CN110348471A (zh) | 异常对象识别方法、装置、介质及电子设备 | |
CN109711733A (zh) | 用于生成聚类模型的方法、电子设备和计算机可读介质 | |
CN113379530A (zh) | 用户风险的确定方法、装置和服务器 | |
CN109840676A (zh) | 基于大数据的风控方法、装置、计算机设备及存储介质 | |
CN112102006A (zh) | 基于大数据分析的目标客户获取方法、搜索方法及装置 | |
CN110516713A (zh) | 一种目标群体识别方法、装置及设备 | |
CN114169439A (zh) | 异常通信号码的识别方法、装置、电子设备和可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170315 |