CN110363662A - 一种个人信用评分系统 - Google Patents
一种个人信用评分系统 Download PDFInfo
- Publication number
- CN110363662A CN110363662A CN201910762884.7A CN201910762884A CN110363662A CN 110363662 A CN110363662 A CN 110363662A CN 201910762884 A CN201910762884 A CN 201910762884A CN 110363662 A CN110363662 A CN 110363662A
- Authority
- CN
- China
- Prior art keywords
- model
- personal credit
- scoring system
- lasso
- personal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
根据本发明的一种个人信用评分系统,包括个人征信模块,用于多个采集与个人信用相关的数据,并将数据存储在数据库中,以及评估模块,将Lasso技术引入到个人信用评估中,建立Lasso‑logistic模型,同时进行变量选择和参数估计,其中,评估模块具有算法模型,该算法模型对相关数据进行预处理后,调用算法程序包得到Lasso‑logistic模型的变量系数表,在变量系数表中选出重要变量,并为重要变量添加相应的权重计算信用分值。本发明的个人信用评分系统克服了现有的评分系统存在着评价指标繁多,无重点且分类混乱,增加评级工作量,各项指标的得分主要是靠经验丰富的工作人员判断,主观性过强等缺陷,具有快速意见预测准确率高的特点。
Description
技术领域
本发明属于信息管理领域,具体涉及一种个人信用评分系统。
背景技术
信用评分是一种统计模型,它通过分析大量的客户历史数据,提取影响信用风险的关键因素,然后构建一个合适的模型来评估新申请人或现有客户的信用风险。因此,构建个人信用评分模型能及时且有效的应对和管理信用风险,不论是对银行,监管机制都将发挥重要作用。随着我国信贷类机构和业务层的发展,信用风险也在各个经济领域中逐渐凸显出来,信贷资产问题不断的成为影响我国经济发展的重大障碍,信用评分成为信用风险管理的核心。
在信息爆炸的这个时代,存在着信用信息不对称的现象,现有的一些评分模型往往无法有效地筛选出危险的客户。目前的信用评级体系存在的一个突出问题,即评价指标繁多,无重点且分类混乱,增加评级工作量,各项指标的得分主要是靠经验丰富的工作人员判断,主观性过强。由于增加过多的客户信息会导致信用评分模型的复杂度,估计偏差和不稳定性。因此,变量选择成为个人信用评估模型中的重点和难点,科学客观的模型变量选择对于信用评分至关重要。
发明内容
随着系统开发技术的不断发展,使用前沿技术在信用评分系统的建设更是少之又少,将变量选择方法应用于信用评分模型的开发具有重要的意义。
为了解决上述问题,本发明使用更加完善的评级方法体系,采用较为客观的数据、结合更新更高效的Vue,SpringBoot,Mybatis技术框架,搭配MySQL数据,利用JavaEE去实现开发了适合国情的信用评级系统,有助于金融机构对客户进行更好的信用分析,对提高金融机构的业务经营和风险管理水平,增加竞争力有很大帮助。
本发明提供了一种个人信用评分系统,具有这样的特征,包括:个人征信模块,用于多个采集与个人信用相关的数据,并将数据存储在数据库中,以及评估模块,将Lasso技术引入到个人信用评估中,建立Lasso-logistic模型,同时进行变量选择和参数估计,其中,评估模块具有算法模型,该算法模型对相关数据进行预处理后,调用算法程序包得到Lasso-logistic模型的变量系数表,在变量系数表中选出重要变量,并为重要变量添加相应的权重计算信用分值。
在本发明提供的个人信用评分系统中,其特征在于,还包括用户管理模块,包括用户注册和登录操作,创建的新用户信息存储在系统的数据库中。
另外,在本发明提供的个人信用评分系统中,其特征在于,还包括消息管理模块,用于向用户提供最新消息动态。
另外,在本发明提供的个人信用评分系统中,还可以具有这样的特征:其中,评估模块基于Lasso筛选出重要的特征变量进入评分模型,对个人征信模块中的相关数据进行变量选择和参数估计,采用数据调用算法对个人信用进行评分。
另外,在本发明提供的个人信用评分系统中,还可以具有这样的特征:其中,有数据变量(xi,yi),i=1,2,...,n,xi=(xi1,xi2,...,xim)是解释变量的观测值,yi是被解释变量的观测值,并且yi是二元离散变量,yi∈{0,1},
Logistic线性回归模型的条件概率可表述为:
式中:ηβ(xi)=Xiβ.,P(yi=1|xi)表示在样本xi下事件yi=1(即违约)的概率;β表示解释变量与x1,x2,...,xm在logisticregression模型中的回归系数。
另外,在本发明提供的个人信用评分系统中,还可以具有这样的特征:其中,回归模型中系数估计值为:
另外,在本发明提供的个人信用评分系统中,还可以具有这样的特征:其中,数据调用算法对相关数据进行预处理,包括缺失值处理、异常值处理、数据非均衡处理。
另外,在本发明提供的个人信用评分系统中,还可以具有这样的特征:其中,算法模型使用R语言调用glmnet算法程序包,得到Lasso-logistic模型的最佳参数λ、变量系数表和模型预测精度。
发明的作用与效果
根据本发明所涉及的个人信用评分系统,因为引入Lasso方法建立评分模型可同时进行变量选择和参数估计,通过实验比较得出Lasso模型具有更科学有效的筛选能力和预测准确率。所以,本发明的个人信用评分系统克服了现有的评分系统存在着评价指标繁多,无重点且分类混乱,增加评级工作量,各项指标的得分主要是靠经验丰富的工作人员判断,主观性过强等缺陷。
附图说明
图1是本发明的实施例中个人信用评分系统模块框图;
图2是本发明的实施例中系统主页的屏幕图;
图3是本发明的实施例中注册页面屏幕图;
图4是本发明的实施例中用户信息数据库页面示意图;
图5是本发明的实施例中用户登录页面屏幕图;
图6是本发明的实施例中征信页面屏幕图;
图7是本发明的实施例中个人征信数据库页面示意图;
图8是本发明的实施例中系统总体设计结构框图;
图9是本发明的实施例中信用评分系统数据库总体关系示意图;
图10是本发明的实施例中个人信用评分流程时序图;
图11是本发明的实施例中评分反馈页屏幕图;以及
图12是本发明的实施例中新闻/知识页面屏幕图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下实施例结合附图对本发明的个人信用评分系统作具体阐述。
个人信用评分是指通过使用科学严谨的分析方法,综合考察影响个人及其家庭的内在和外在的主客观环境,并对其履行各种经济承诺的能力进行全面的判断和评估。
个人信用评分系统(Credit Scoring System)是一套定量评估个人信用风险的应用系统,它通过对个人客户信息进行量化计算得出信用分值,反映个人客户的信用状况.个人信用评分系统广泛地应用于个人信贷、信用卡、保险理赔等金融业务中,为信用政策的制定、分析、评估、优化提供量化支持。
本实施例提供一种基于Lasso变量选择的个人信用评分的系统,用于提高个人信用评分的效率和真实性。
Lasso变量选择:通过将不显著变量的回归系数压缩为零来剔除这些变量,对显著变量进行很小的压缩或者不压缩而保留在回归模型中,最终实现变量选择和参数估计。
如图1所示,本实施例中个人信用评分系统主页的屏幕图。
如图1所示,个人信用评分系统包括用户管理模块、个人征信模块、评估模块和消息管理模块。
个人信用评分系统用于对个人用户的管理、对个人信息的征集、对个人信用评分并展示反馈评级结果以及消息管理。
用户管理模块中,新用户进入如图2所示系统主页时,可单击注册按钮实现新用户的注册创建。
用户管理模块包括注册和登录,注册页面如图3所示,创建的新用户信息在如图4所示的数据库中存储,对于已有的用户则可填写用户名和密码在如图5所示的页面登陆。
个人征信模块用于有效的采集个人信用信息,将数据存储在数据库。
个人征信模块是针对已经注册登陆的用户,用户在如图5所示的登陆页面登陆后,进行个人征信,单击系统主页中的个人征信,进入如图6所示的个人征信页面,用户可进行信息录入和存储,提交信息完成时系统会检测录入数据的正确性和完整性,随后存储在如图7所示的数据库中,为后期的信用评分奠定信息基础。
登陆后的用户可在如图6所示的页面进行信息更新和维护,还可查看评分反馈,浏览页面新闻等。
系统根据功能需求搭建前端界面,然后根据征信数据设计和搭建数据库,最后终端调用数据库信息对个人进行评分。
如图8所示,功能需求分析包括界面设计、数据收集、整理以及功能设计。
数据库的设计与实现
根据系统的整体框架,并根据需求分析设计系统数据库,用软件画出如图9所示的信用评分系统数据库总体关系示意图。
新用户注册登陆后录入个人征信信息,通过数据预处理后进入模型,筛选变量后根据指标权重计算得分反馈给用户,终端可发布和管理信息消息。
用MySQL关系型数据库分别建立User信息表(表1)、Usedetails表(表2)、News表(表3)。
User信息表中存储系统中的所有用户,主要包括:用户ID,用户名,用户密码,用户创建时间,用户更新时间等。
表1 User信息表
Usedetails表记录用户个人的基本相关信息,主要包括:性别,婚姻情况,学历,贷款目的,账户余额等,其中userid为该表的主键,该表的具体属性定义和描述如如下:
表2 Usedetails表属性和定义
News信息表中存储系统中的发布的所有信贷新闻和信贷知识文章,主要包括:标题,内容,作者等。
表3 News表属性和定义
评估模块利用个人征信模块中相关数据,对个人信用进行评分,本实施例根据数据调用算法对个人信用进行评分,基于Lasso筛选出重要的特征变量进入评分模型,从而提高模型的性能。
Lasso-logistic模型
在个人信用信息数据库的基础上建立个人信用评分,良好的信用评分模型是个人信用评分系统中不可或缺的一部分。在实际中影响个人信用的因素有很多,本实施例将Lasso技术引入到个人信用评估中,建立Lasso-logistic模型,同时进行变量选择和参数估计。
假设有数据变量(xi,yi),i=1,2,...,n,其中xi=(xi1,xi2,...,xim)是解释变量的观测值,yi∈{0,1},是被解释变量的观测值。在一般的回归模型中,常常认为解释变量和被解释变量的观测值彼此独立。同时,假设xij是标准化的。即令Lasso方法的估计量为:
其中t≥0是调和参数,此时对一切的t有α的估计不失一般性,假定这样可将上式整理为:
它可以用以下惩罚函数的形式表达:
该式的第一部分表示模型拟合的优良性,第二部分表示参数的惩罚。调和系数λ∈[0,+∞]越小,模型的惩罚力度就越小,保留的变量就越多;λ越大,模型的惩罚力度就越大,保留的变量就越少。
Lasso方法主要应用于线性模型,其本质是在残差平方和上添加惩罚函数,在估计参数时,系数被压缩,部分系数甚至被压缩到0来实现模型变量选择.但是对于信用违约预测时,其因变量是二元离散取值,此时不能再利用线性回归模型,而应该使用Lasso-logistic。惩罚Logistic回归(PenalizedLogisticRegression)是对Logistic回归模型的一种修正,通过对负的对数似然函数增加非负的惩罚项,来实现很好地控制系数。
假设有数据变量(xi,yi),i=1,2,...,n,其中xi=(xi1,xi2,...,xim)是解释变量的观测值,yi是被解释变量的观测值,并且yi是二元离散变量,yi∈{0,1}.Logistic线性回归模型的条件概率可表述为:
式中:ηβ(xi)=Xiβ.,P(yi=1|xi)表示在样本xi下事件yi=1(即违约)的概率;β表示解释变量与x1,x2,...,xm在logisticregression模型中的回归系数。
Lasso-logistic回归模型中的系数估计值由下式凸函数的极小值给定:
其中l(·)是对数似然函数,则上式中的l(β)可以写成:
即Lasso-logistic回归模型中的系数估计值可以写成如下形式:
算法模型部分,先使用R软件对训练集数据进行预处理,原数据主要来源于国内某借贷机构,该数据集里共有8000条记录,包括25个字段,其中23个字段是对贷款人的个人特性描述,还有一个贷款人编号和该贷款人信用风险评估的结果,其中,“0”表示履约客户,“1”表示违约客户。
原始数据中存在缺失,异常数据,需要在分析前对其缺失值填补和异常值检测.本文处理缺失值的方法是平均值填充,并且利用散点图探测异常值。在原始数据中,如合同金额,贷款余额,已用额度等为连续型变量,为了克服量纲的影响,需要将其F-score标准化处理后再进行分析.与此同时,样本数据中履约用户和违约用户比例约为9:2,为非对称分布问题,这会影响模型对数据容量相对少的违约客户的预测精度.所以,对履约用户采用欠抽样方法,即从样本较多的数据中选取部分具有代表性的数据,以此减少多数样本,达到数据平衡.最终所用数据集划分成训练集和测试集,其中,训练集有3002条数据,包括1500条履约和1502条违约数据;而测试集有519条数据,包括258条履约和261条违约数据。
对数据中的变量进行分类,编码处理之后的数据变量如表所示:
后使用R语言调用glmnet算法程序包,得到Lasso-logistic模型的最佳参数λ=0.01122485,变量系数表和模型预测精度,后根据变量系数表中选择的重要变量。评分逻辑是在选出的重要变量中,为这些变量添加适当权重计算信用分值。
变量系数表
在Logistic回归模型中,因变量是对数发生比logit,当对数发生比增大时,的值也相应增加,即判定信用为1(即“违约”)的概率加大.系数为负值时,说明变量对违约有反向的制约作用;而当系数为正值时,相应的变量对违约有正向的促进作用,而且的值越大,对应的对客户的信用判定为违约的促进作用就越大。Lasso-logistic模型在进行变量选择时,从系数表中得出系数被压缩为0的变量有16个,即选出了18个重要变量进入模型,减低了计算复杂度。
在现实的信用风险评估当中,将违约用户错分为未违约用户的这一类错误对银行或社会等造成的潜在损失更大。所以,模型对违约用户的正确分类更为重要,然后才考虑对未违约用户的判断。
Lasso-logistic模型预测正确率
从模型预测正确率表中,可以看出:在训练集中,Lasso-logistic模型对违约用户的预测高达79.96%,比全变量模型高出4.31%,比向前和先后选择分别高出6.39%和6.19%;在测试集中,Lasso-logistic模型对违约用于的预测也是最好的,达到了79.46%.其次再来看对未违约用户的分类情况,无论是在训练集还是在测试集中,Lasso-logistic的正确率都是最优的,向前选择模型对未违约用户的预测准确率则最差.模型总体的预测准确率中,逐步选择在测试集中的分类情况不佳,Lasso-logistic在训练集上达到77.21%,在测试集中Lasso-logsitic模型总体预测率最高,达到77.07%。
基于Lasso变量选择的算法模型能更好的选择重要变量,在一定程度上增强了模型中变量的可解释性;Lasso进行变量选择后的评分模型,对于违约用户的预测准确率也最高。
对于评估模块来讲,根据业务流程给出如图10所示的个人信用评分流程时序图,该信用评分系统的基本业务流程如下:
申请者将个人基本信息和相关证明材料等提交给业务部门,由业务部门对申请者提交的信息进行核实,业务部门判断信息真实性,若信息情况不属实则退回申请并说明拒绝理由;若信息属实,则将其信息提交至评估部门.之后,系统评估终端在数据库调用数据,进入评级模型,选择重要的指标,根据模型中各指标给予的权重,计算个人的最终信用评级得分,得到如图11所示的信用评分反馈模块用于反馈个人信用分值。
消息管理模块中,用户可单击新闻/知识按钮跳转到如图12所示的相关页面,了解最新消息动态。
页面设计和功能实现
本实施例使用前沿的Vue,SpringBoot,Mybatis技术框架,搭配MySQL数据库,综合的运用Webstorm、Chrome、IntelliJ IDEA开发软件去实现本发明的页面和功能设计。
(1)Vue框架
Vue.js是一套构建用户界面的渐进式框架,是一个基于MVVM模式的JavaScript库。Vue.js采用了自底向上的增量式开发的设计。它的核心库只专注于View层,对开发者来说学习易于上手,开发效率高。库整合起来也很容易.Vue.js的显著特性有:轻量级的框架,双向数据绑定,指令,插件化。
(2)SpringBoot框架
Spring是Java众多开源框架中的其中一个,是为了解决企业应用开发的复杂性而创建的.框架的主要优势之一就是其分层架构,同时为J2EE应用程序开发提供集成的框架。
从简单性,可测试性等角度而言,任何Java应用都可以从Spring中受益。
Spring的核心是控制反转(IoC)和面向切面(AOP).简单来说,Spring是一个分层的JavaSE/EE full-stack(一站式)轻量级开源框架。
不可否认Spring框架是非常强大的,但在对于很小的项目中,往往也需要进行大量的操作配置,这样会使得工作比较繁琐,而且常常会因为配置问题产生出大量的异常情况,从而导致开发效率的降低。为了让开发人员能专注于业务逻辑开发,所以有必要简化新Spring应用的初始搭建以及开发过程。那么,在2013年由Pivotal团队提出一种基于SpringBoot的全新框架,该框架使用了特定的方式来进行配置,从而使开发人员不再需要定义样板化的配置.正因为SpringBoot框架能在各个方面的配置,包括程序搭建,开发和部署等化繁为简,让开发变得即简单又快捷,基于“约定优先配置”的原则,所以在业界备受关注,SpringBoot在国内的关注趋势也日渐超过Spring.
(3)Mybatis框架
前身是Ibatis框架,是Apache软件基金会下的一个开源项.2010年迁移到Googlecode下,正式改名为Mybatis.在运用Java Web开发应用系统,对数据库的访问通常通过Java数据库连接技术来实现.为了简化对数据库的操作,在对数据封装后进行调试会产生许多持久层框架,本发明运用MyBatis框架.该框架只需要关注业务本身,不需花费精力去处理创建数据库连接对象,参数设置等繁杂的过程代码.Mybatis通过xml或注解进行配置,将java对象与sql语句中的参数自动映射生成最终执行的sql语句,并将sql语句执行结果自动映射成java对象,返回给业务层(service)应用.
(4)WebStrom
WebStorm这一款JavaScript开发工具是JetBrains公司旗下的。WebStorm
是一个智能的,强大的代码编辑器,目前已经被大多的中国JS开发者熟知应用,并被誉为“最强大的HTML5编辑器”,“Web前端开发神器”,“最智能的JavaScript IDE”等.WebStorm本身集成了语法着色,代码补全,代码分析,代码导航,格式化,快捷键,参考文档,实时纠错提示,代码重构,脚本调试,收藏夹,文件模板,语言混编等等功能特点.
(5)Chrome
由Google开发的Google Chrome是一款设计简单,高效的Web浏览工具,具有简洁,快速的鲜明特点.对于Web开发者来说Chrome浏览器的最大优点在于其优秀的调试功能,打开浏览器之后,在当前网页直接点击F12,就会进入Chrome浏览器的开发者工具界面,此界面一共分为八大模块,包括:Elements,Network,Source,Timeline,Profiles,Resource,Console,Audits,可进行编辑和查看当前页面HTML和CSS元素,监控错误,断点调试,监控网络请求等功能,为前端开发提供便利.
(6)IntelliJ IDEA
IntelliJ IDEA是java语言开发的集成环境,IntelliJ IDEA在业界被公认为最好的java开发工具之一.IntelliJ IDEA也是JetBrains公司的产品,IDEA的特色功能非常多,包括:智能的选取,历史记录功能,代码检查,对重构的优越支持,丰富的导航模式等等,其最突出的功能自然是调试(Debug),可以对Java代码,JavaScript,JQuery,Ajax等技术进行调试.
(7)MySQL
数据库是项目系统的关键所在.在Web应用方面,MySQL是最好的RDBMS(Relational Database Management System,关系数据库管理系统)应用软件,由瑞典MySQLAB公司开发.MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言,MySQL作为一个中型数据库,有体积小,速度快,总体拥有成本低,源代码开放的特点.在测试上或者一些中小企业应用,MySQL是一个不错的选择.作为一个开放源代码的中型数据库,MySQL支持多线程,使用标准的SQL数据语言,优化SQL查询算法等诸多优势。
实施例的作用与效果
根据本实施例所涉及的个人信用评分系统,因为引入Lasso方法建立评分模型可同时进行变量选择和参数估计,通过实验比较得出Lasso模型具有更科学有效的筛选能力和预测准确率。所以,本发明的个人信用评分系统克服了现有的评分系统存在着评价指标繁多,无重点且分类混乱,增加评级工作量,各项指标的得分主要是靠经验丰富的工作人员判断,主观性过强等缺陷。
另外,本实施例还结合更高效的Vue,SpringBoot,Mybatis技术框架,搭配MySQL数据,利用JavaEE方法具有收到系统性能稳定、方便快捷、页面流畅、利于后期维护的优点。
上述实施方式为本发明的优选案例,并不用来限制本发明的保护范围。
Claims (8)
1.一种个人信用评分系统,其特征在于,包括:
个人征信模块,用于多个采集与个人信用相关的数据,并将所述数据存储在数据库中,以及
评估模块,将Lasso技术引入到个人信用评估中,建立Lasso-logistic模型,同时进行变量选择和参数估计,
其中,所述评估模块具有算法模型,该算法模型对相关数据进行预处理后,调用算法程序包得到所述Lasso-logistic模型的变量系数表,在所述变量系数表中选出重要变量,并为所述重要变量添加相应的权重计算信用分值。
2.根据权利要求1所述的个人信用评分系统,其特征在于,还包括:
用户管理模块,包括用户注册和登录操作,创建的新用户信息存储在系统的数据库中。
3.根据权利要求1所述的个人信用评分系统,其特征在于,还包括:
消息管理模块,用于向用户提供最新消息动态。
4.根据权利要求1所述的个人信用评分系统,其特征在于:
其中,所述评估模块基于Lasso筛选出重要的特征变量进入评分模型,对所述个人征信模块中的所述相关数据进行变量选择和参数估计,采用所述数据调用算法对个人信用进行评分。
5.根据权利要求1所述的个人信用评分系统,其特征在于:
其中,有数据变量(xi,yi),i=1,2,...,n,xi=(xi1,xi2,...,xim)是解释变量的观测值,yi是被解释变量的观测值,并且yi是二元离散变量,yi∈{0,1},
Logistic线性回归模型的条件概率可表述为:
式中:ηβ(xi)=Xiβ.,P(yi=1|xi)表示在样本xi下事件yi=1(即违约)的概率;β表示解释变量与x1,x2,...,xm在logisticregression模型中的回归系数。
6.根据权利要求5所述的个人信用评分系统,其特征在于:
其中,所述回归模型中系数估计值为:
7.根据权利要求1所述的个人信用评分系统,其特征在于:
其中,所述数据调用算法对相关数据进行预处理,包括缺失值处理、异常值处理、数据非均衡处理。
8.根据权利要求1所述的个人信用评分系统,其特征在于:
其中,所述算法模型使用R语言调用glmnet算法程序包,得到Lasso-logistic模型的最佳参数λ、所述变量系数表和模型预测精度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910762884.7A CN110363662A (zh) | 2019-08-19 | 2019-08-19 | 一种个人信用评分系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910762884.7A CN110363662A (zh) | 2019-08-19 | 2019-08-19 | 一种个人信用评分系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110363662A true CN110363662A (zh) | 2019-10-22 |
Family
ID=68224009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910762884.7A Pending CN110363662A (zh) | 2019-08-19 | 2019-08-19 | 一种个人信用评分系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110363662A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112147083A (zh) * | 2020-10-14 | 2020-12-29 | 武汉轻工大学 | 种子纯度检测方法、检测装置及计算机可读存储介质 |
CN112732812A (zh) * | 2020-12-31 | 2021-04-30 | 中国科学技术大学智慧城市研究院(芜湖) | 一种基于大数据画像的个人信用分析方法 |
CN113219173A (zh) * | 2021-05-11 | 2021-08-06 | 中南大学湘雅医院 | Sh2b1在肺癌诊断中的应用 |
CN113269422A (zh) * | 2021-05-15 | 2021-08-17 | 中证鹏元资信评估股份有限公司 | 一种具有信息对比功能的信用评级系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102117469A (zh) * | 2011-01-18 | 2011-07-06 | 中国工商银行股份有限公司 | 一种对信用风险进行评估的系统和方法 |
CN106408184A (zh) * | 2016-09-12 | 2017-02-15 | 中山大学 | 一种基于多源异构数据的用户信用评估模型 |
CN107122890A (zh) * | 2017-04-07 | 2017-09-01 | 信雅达系统工程股份有限公司 | 个人信用得分优化评价方法 |
-
2019
- 2019-08-19 CN CN201910762884.7A patent/CN110363662A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102117469A (zh) * | 2011-01-18 | 2011-07-06 | 中国工商银行股份有限公司 | 一种对信用风险进行评估的系统和方法 |
CN106408184A (zh) * | 2016-09-12 | 2017-02-15 | 中山大学 | 一种基于多源异构数据的用户信用评估模型 |
CN107122890A (zh) * | 2017-04-07 | 2017-09-01 | 信雅达系统工程股份有限公司 | 个人信用得分优化评价方法 |
Non-Patent Citations (2)
Title |
---|
侯澄钧: "热门数据挖掘模型应用入门(一):LASSO回归", 《统计之都》 * |
张婷婷 等: "个人信用评分的Adaptive Lasso-Logistic回归分析", 《数学的实践与认识》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112147083A (zh) * | 2020-10-14 | 2020-12-29 | 武汉轻工大学 | 种子纯度检测方法、检测装置及计算机可读存储介质 |
CN112147083B (zh) * | 2020-10-14 | 2023-07-11 | 武汉轻工大学 | 种子纯度检测方法、检测装置及计算机可读存储介质 |
CN112732812A (zh) * | 2020-12-31 | 2021-04-30 | 中国科学技术大学智慧城市研究院(芜湖) | 一种基于大数据画像的个人信用分析方法 |
CN113219173A (zh) * | 2021-05-11 | 2021-08-06 | 中南大学湘雅医院 | Sh2b1在肺癌诊断中的应用 |
CN113269422A (zh) * | 2021-05-15 | 2021-08-17 | 中证鹏元资信评估股份有限公司 | 一种具有信息对比功能的信用评级系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11526579B1 (en) | System and methods for performing automatic data aggregation | |
US20190347282A1 (en) | Technology incident management platform | |
Falessi et al. | Decision-making techniques for software architecture design: A comparative survey | |
CN110363662A (zh) | 一种个人信用评分系统 | |
Kurgan et al. | A survey of knowledge discovery and data mining process models | |
US11328119B2 (en) | Domain-specific language interpreter and interactive visual interface for rapid screening | |
Ratajczyk et al. | Challenges and opportunities in coding the commons: problems, procedures, and potential solutions in large-N comparative case studies | |
CN106067094A (zh) | 一种动态评估方法及系统 | |
US20060010058A1 (en) | Multidimensional database currency conversion systems and methods | |
Robiolo et al. | Employing use cases to early estimate effort with simpler metrics | |
CN110751361B (zh) | 一种银行需求条目级管理方法及系统 | |
CN115547466B (zh) | 基于大数据的医疗机构登记评审系统及其方法 | |
CN115115257A (zh) | 一种基于关系图谱的企业风险预警方法及系统 | |
Palaneeswaran et al. | Web-based client advisory decision support system for design–builder prequalification | |
Dhir et al. | Balanced scorecard on top performing Indian firms | |
Zhang et al. | Search and similarity based selection of use case scenarios: An empirical study | |
Niedermann | Deep Business Optimization: concepts and architecture for an analytical business process optimization platform | |
US20160092807A1 (en) | Automatic Detection and Resolution of Pain Points within an Enterprise | |
CN116126911A (zh) | 数据分析方法及装置 | |
Grambau et al. | Reference Architecture framework for enhanced social media data analytics for Predictive Maintenance models | |
US20140149186A1 (en) | Method and system of using artifacts to identify elements of a component business model | |
US20130325531A1 (en) | Business case development by dynamically reusing business case components | |
Ciancarini et al. | Squap-ont: an ontology of software quality relational factors from financial systems | |
Silverberg et al. | Long memory and economic growth in the world economy since the 19th century | |
Heiskanen | Data Quality in a Hybrid MDM Hub |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191022 |