CN107025596B - 一种风险评估方法和系统 - Google Patents

一种风险评估方法和系统 Download PDF

Info

Publication number
CN107025596B
CN107025596B CN201610070616.5A CN201610070616A CN107025596B CN 107025596 B CN107025596 B CN 107025596B CN 201610070616 A CN201610070616 A CN 201610070616A CN 107025596 B CN107025596 B CN 107025596B
Authority
CN
China
Prior art keywords
variable
variable group
model
group
risk assessment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610070616.5A
Other languages
English (en)
Other versions
CN107025596A (zh
Inventor
刘江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610070616.5A priority Critical patent/CN107025596B/zh
Priority to PCT/CN2017/071920 priority patent/WO2017133492A1/zh
Priority to EP17746812.1A priority patent/EP3413221A4/en
Priority to KR1020187007365A priority patent/KR102061987B1/ko
Priority to JP2018513514A priority patent/JP6771751B2/ja
Publication of CN107025596A publication Critical patent/CN107025596A/zh
Priority to US16/024,159 priority patent/US20180308160A1/en
Application granted granted Critical
Publication of CN107025596B publication Critical patent/CN107025596B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Technology Law (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • Algebra (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)

Abstract

一种风险评估方法和系统,通过挖掘有价值的弱变量加入风险评估模型,使风险评估的考量因素更全面,解释性和稳定性更强,有助于提高风险评估的准确性,并保证风险评估的客观性。一些可行的实施方式中,方法包括:根据数据源与目标变量的相关性和/或数据源与用户信息的相关性,进行变量分组,得到至少一个第一类变量组和至少一个第二类变量组;针对所述至少一个第二类变量组分别构建风险评估模型,得到每个第二类变量组的风险评估模型的模型结果;将每个第二类变量组的模型结果作为一个变量,与所述至少一个第一类变量组中的全部全量合并,组成第三类变量组;针对所述第三类变量组构建风险评估综合模型。

Description

一种风险评估方法和系统
技术领域
本发明涉及基于计算机技术的风险评估技术领域,具体涉及一种风险评估方法和系统。
背景技术
风险评估是对信息所面临的威胁、存在的弱点、造成的影响等所带来风险的可能性的评估。常用的风险评估方法有模型法和专家法两种。
模型法是指利用逻辑回归、决策树、随机森林等机器学习方法构建风险评估模型,基于模型结果进行风险评估的方法。实践发现,有些弱变量可能在业务上非常有意义,但是,模型法中,弱变量不能入选模型,导致模型法不能反映某些变量的作用,难以反映业务发展的未来趋势。
专家法是指根据专家意见,确定评估的考量因素,进行风险评估的方法。专家法可以解决弱变量无法入选模型的问题,但是,专家法是一种有较大的主观性的方法,没有充分挖掘和利用数据的价值。
发明内容
本发明实施例提供一种风险评估方法,通过挖掘有价值的弱变量加入风险评估模型,使风险评估的考量因素更全面,解释性和稳定性更强,有助于提高风险评估的准确性,并保证风险评估的客观性。
本发明第一方面提供一种风险评估方法,包括:根据数据源与目标变量的相关性和/或数据源与用户信息的相关性,进行变量分组,得到至少一个第一类变量组和至少一个第二类变量组;针对所述至少一个第二类变量组分别构建风险评估模型,得到每个第二类变量组的风险评估模型的模型结果;将每个第二类变量组的模型结果作为一个变量,与所述至少一个第一类变量组中的全部全量合并,组成第三类变量组;针对所述第三类变量组构建风险评估综合模型。
本发明第二方面提供一种风险评估系统,包括:预处理模块,用于根据数据源与目标变量的相关性和/或数据源与用户信息的相关性,进行变量分组,得到至少一个第一类变量组和至少一个第二类变量组;第一构建模块,用于针对所述至少一个第二类变量组分别构建风险评估模型,得到每个第二类变量组的风险评估模型的模型结果;变量组合模块,用于将每个第二类变量组的模型结果分别作为一个变量,与所述至少一个第一类变量组中的全部全量合并,组成第三类变量组;第二构建模块,用于针对所述第三类变量组构建风险评估综合模型。
由上可见,在本发明的一些可行的实施方式中,采用对变量分组,得到两类变量组,针对其中第二类变量组中的每个变量组分别构建风险评估模型,将该类的每个变量组的模型结果作为一个变量,与第一类变量组中的变量合并,组成第三类变量组,最后针对该第三类变量组构建风险评估综合模型的技术方案,取得了以下技术效果:
该方法充分的挖掘和利用了第二类变量组的数据价值,各个第二类变量组中的各个变量反映在最终构建的综合模型中,从而使风险评估考量因素更全面,解释性更强,模型稳定性更强,模型结果尽量客观和准确,应用中也更具鲁棒性,有助于提高风险评估效果,有助于反映业务发展的未来趋势。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一个实施例提供的一种风险评估方法的流程示意图;
图2是采用传统模型方法构建模型的过程示意图;
图3是采用本发明实施例风险评估方法构建模型的过程示意图;
图4是本发明一个实施例提供的一种风险评估系统的结构示意图;
图5是本发明一个实施例提供的一种计算机设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明实施例技术方案涉及基于计算机系统的风险评估方法。下面首先对风险评估方法涉及到的一些术语进行简单说明。
贯穿本说明书,术语“风险评分卡”是指:一种风险评估模型,例如用于评估用户信用风险高低的风险评估模型,通常有监督学习和半监督学习(如果有拒绝推断的话)两种。监督目标(即目标变量)通常是用户在一段时间内是否违约,比如用户在发放贷款后6个月内是否发生90天以上逾期。构建风险评分卡的方法通常分为两类:模型法和专家法。
术语“弱变量”是指:在统计上不显著,即显著性假设检验的P值(P-Value,Probability,Pr)大于或等于设定标准例如0.05,按此统计标准无法入选风险评估模型的变量。相对的,术语“强变量”是指:在统计上比较显著,即显著性假设检验的P值小于设定标准例如0.05,满足显著性统计标准的变量。需要说明的是,设定标准也可以是0.05以外的值,例如0.01等,本文对此不予限定。值得说明的是,假设检验是推断统计中的一项重要内容。用专业统计软件进行假设检验时,P值是进行检验决策的一个依据。P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P值,一般可以P<0.05为显著,其含义是样本间的差异由抽样误差所致的概率小于0.05。
术语“变量组”是指:数据源相同的一组变量,术语“强变量组”是指:与目标变量的相关性较高和/或与用户信息的相关性较高的变量组,“弱变量组”是指目标变量的相关性较低和/或与用户信息的相关性较低的变量组。其中,相关性可以用相关系数例如P值来表达,可以计算变量组中所有变量的P值的平均值,平均值大于阈值时,认为该变量组与目标变量的相关性较高,不大于阈值时,认为该变量组与目标变量的相关性较低。
术语“专家评分卡”是指:基于行业专家经验设计的风险评分卡。专家评分法即是基于专家评分卡进行风险评估的方法。
术语“逻辑回归(logistic regression,LR)”是指:目前应用比较成熟、广泛的用于开发风险评分卡的一种方法,是一种广义的线性回归方法。
术语“决策树”是指:一种逼近离散函数值的方法。决策树是一种典型的分类方法,也可以用来构建预测模型。首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策树对新数据进行分析。本质上,决策树是通过一系列规则对数据进行分类的过程。决策树的典型算法有ID3,C4.5,CART(Classification And Regression Tree,分类回归树算法)等。
术语“层次分析法”是指:是将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法。
术语“变量归一化”是指:变量标准化处理的一种操作,目的是为了使具有不同量纲的变量具有可比性。归一化有不同的方法,本文可以采用最小-最大规范化方法,变量处理后的取值区间均为[0,1]。
术语“模型鲁棒性(Robustness)”是指:指模型从开发到实施过程中的稳定性,鲁棒性高的模型实施效果更理想。
术语“KS(Kolmogorov Smirnov)”是指:一种衡量评分模型效果好坏的常用指标,Kolmogorov和Smirnov两位前苏联数学家的名字,KS是处于0-100之间,值越大代表模型效果越好。通常情况下KS=25左右是金融机构对风险评估的接受标准。
下面,简单介绍模型法。
模型法是最为常用的一种风险评估方法,模型法构建的风险评估模型(一种逻辑模型)可称为风险评分卡。构建风险评分卡的传统方法有很多,比如逻辑回归法、决策树、随机森林等。其中,逻辑回归/逐步回归法(logistic/stepwise)是目前应用最为广泛、最成熟的方法之一。下面以逻辑回归法为例,介绍风险评分卡的基本建模过程包括:
首先,准备好一张归一化的建模宽表如表1,表1中变量x的数量一般至少会在数百以上。假设表1中共10000个用户样本和300个属性(即变量)。表1中总共包含数据源不同的三类变量:支付、即时通信和社交。假设这三类变量每类分别有100个变量,总共300个变量。表1中第二列的Y即是监督目标或者说目标变量,具体可以是指用户在发放贷款后1年内是否发生90天以上逾期。表中每个变量的值都是归一化后的值,因此值均落在[0,1]之间。
需要说明的是,本发明实施例中所说的变量均来自于合法的数据源,如包括用户数据或者公众可查询的数据,且用户数据是经过用户授权使用的数据。
表1建模宽表
Figure BDA0000919885730000051
容易理解,三类变量中,支付类变量与金融直接相关,相关性较高,可认为是强变量组,即时通信和社交类变量与金融的相关性较低,可认为是弱变量组。
假设表1中,第1-15个变量属于强变量组中的强变量,第16-30个属于弱变量组中的强变量。经过一系列变量分析和变量筛选后,正常的结果可能是,强变量组的前15个强变量和弱变量组的第16-18个强变量进入了最终的逻辑回归模型。得到的逻辑回归模型结果如式(1)和(2):
Figure BDA0000919885730000052
Probability=exp(Logodds15)/(1+exp(Logodds15)) (2)
其中,Logodds是逻辑回归模型的输出结果(简称模型结果),Probability是概率参数,Probability表示所述模型结果Logodds变坏的概率。
可见,弱变量组中只有x16、x17和x18等3个变量入选模型,其余变量未进入模型。虽然可通过降低select in/out(选择输入/输出)筛选标准,或者强行加入(force in)的方法,把弱变量组中的其他强变量(比如x19-x30)放入模型,但是其对模型的贡献并不能效地反映出来,或者说弱变量组在风险评分卡中的权重过低。这种做法还有一个显著的缺点是,这些通过放低标准新入选的弱变量组的变量可能很不稳定。
下面,简单介绍专家法。
专家评分卡是基于行业专家经验设计形成的评分逻辑模型。专家评分卡在业务开展初期非常有用,另外,在一些用户量相对较少的对公业务中也经常被用到。传统的专家评分卡会事先搜集专家意见,确定制订评分的考量因素,即所用变量范围,然后再确定每个变量的权重,最终得到业务上所需要的专家评分卡。数据和变量假设同模型法中的表1完全一样,则专家评分卡如表2:
表2专家评分卡
Figure BDA0000919885730000061
专家评分卡解决了模型法对于弱变量组的大部分变量无法入选模型的问题,并且理解和实施起来都比较容易。但是专家评分卡有一个致命的缺陷:没有充分挖掘和利用数据的价值,有比较大的主观性。比如,该方法未考虑变量的协相关性及协同作用,而且变量值在未来可能波动比较大,从而导致模型不太稳定。
如上文所述,现有风险评分卡构建方法主要分专家法和模型法两类。这两类方法在行业应用中都比较成熟,但它们的缺陷也是非常明显的,模型法的缺陷主要是弱变量无法入选,不能反映业务发展趋势的问题;专家法的缺陷主要是,方法带有较大的主观性,不能最大化地挖掘和利用数据的价值。
为此,本发明实施例提供一种风险评估方法和系统,下面分别进行介绍。
(实施例一、)
请参考图1,本发明第一实施例提供一种风险评估方法,该方法可以包括:
110、根据数据源与目标变量的相关性和/或数据源与用户信息的相关性,进行变量分组,得到至少一个第一类变量组和至少一个第二类变量组。
随着互联网快速发展,信息和数据越来越多,风险评估方法所用到的数据源也越来越广泛,有些和信用风险相关性比较强,有些比较弱。本文中,首先根据数据源对变量进行分组,将来源相同的一类变量视为一个变量组,例如,来源自支付、即时通信、社交的三类变量可视为三个变量组。本文中,还对变量组进行分类,将所有的变量组分为强变量组和弱变量组两类。有些变量和用户信息例如资金直接相关,和用户信用风险具有较强的相关性,这类变量可被称之为强变量组,比如用户理财、储蓄、消费、支付等;而有些变量和金融并不直接相关,只是反映出用户的一些社交和行为习惯,因此和信用风险的相关性较小,这类变量可称之为弱变量组,比如即时通信、社交、游戏等。
变量组分类的因素可以包括但不限于以下两种:
一、数据源与目标变量(例如是否违约)的相关性。
相关性分析一般可用皮尔逊(Pearson Correlation Coefficient,Pearson)相关系数,其计算方法这里不再赘述。相关性强弱的标准一般可以是:0.6以上是强相关,0.4-0.6中等相关,0.2-0.4弱相关,0.2以下极弱相关或无相关。但是金融界实际应用的标准与之相差比较远,相关性强弱的标准一般要低得多,因为相关系数在0.4以上的变量极其少见。也就是说,可以根据需要自行定义相关性强弱的标准,举例来说,针对支付类的变量可以定义0.1以上是强相关,0.1以下以弱相关,等。
二、数据源与用户信息(例如资金)的相关性。
相关性大小和变量类别的关系也非常大,通常和用户资金等信息距离比较近的变量的相关性比较大,如贷款、理财和支付等;而距离用户资金距离比较远的变量的相关系数也比较小,如即时通信、社交等变量。应用中,可以用重要程度值表示数据源与用户信息的相关性,例如,强、中、弱等。
本文中可以根据上述两个标准,即根据数据源与目标变量的相关性和/或数据源与用户信息的距离,进行变量组分类,分为强变量组和弱变量组。强变量组即是所述的第一类变量组,弱变量组即是所述的第二类变量组。
一些实施例中,变量组分类的具体方法可以包括:
a0、根据数据源的不同,将所有变量分为多个变量组;
a1、根据数据源与目标变量的相关性,计算任一个变量与目标变量的相关系数,并计算所述多个变量组中每个变量组的平均相关系数;所说的相关系数可以是上文提到的P值。
a2、根据数据源与用户信息的相关性,确定所述多个变量组中每个变量组的重要程度值;
a3、根据所述多个变量组的平均相关系数和/或重要程度值进行变量组分类,将所述平均相关系数大于阈值和/或重要程度值最高的变量组分类为第一类变量组,即强变量组,将其它变量组分类为第二类变量组,即弱变量组。
可见,强变量组是指与目标变量的相关性较高和/或与用户信息的相关性较高的变量组,弱变量组是指目标变量的相关性较低和/或与用户信息的相关性较低的变量组。
如表3所示,是一个应用场景例中变量组分类的示意图。每类变量的相关性强弱标准也不相同,结合实际经验设定的相关性强弱标准的阈值例如可以是:支付类为0.1,即时通信类为0.05,社交类为0.06。大于阈值的认为是强变量,小于阈值的认为是弱变量。支付类变量中,较强的变量有反映用户还款能力的信用卡还款,以及反映用户还款能力的资金规模等;较弱的变量有用户交易的频率、用户电话卡充值等。即时通信类变量中,较强的变量有反映用户稳定性的常用登陆城市个数等,较弱的变量有收发信息条数等。社交类变量中,较强的变量有粘性较高的好友数量、好友质量等,较弱的变量有好友的个数、收发信息量等。
为了表述方便,把这三类变量的变量名和表1对应起来,具体见表3的第3行和第4行。按上述变量强弱标准的阈值,每类变量的强变量和弱变量个数分别是:支付变量为15和85,即时通信变量为8和92,社交为7和93。
表3变量分组
Figure BDA0000919885730000091
由表3可见,可以按照数据源的不同将来源于支付、即时通信和社交的三类变量分为三组,即变量组A、B和C,其中,变量组A的平均相关系数最高且重要程度值最高,因此变量组A为强变量组,变量组B、C为弱变量组。
值得说明的是,弱变量组不同于弱变量。弱变量组中也可能有强变量,只不过和目标变量的相关性并不是很高。同样地,强变量组中也可能含有弱变量。当然,弱变量更容易出现弱变量组中,强变量更容易出现在强变量组中。虽然弱变量组中的很多变量在统计上是显著的,但是,当把它们和强变量组放在一起建模时,弱变量组中的变量通常只有少数能进入模型,弱变量组的作用会被大大稀释,无法发挥应有的作用。
120、针对至少一个第二类变量组分别构建风险评估模型,分别得到每个第二类变量组的风险评估模型的模型结果。
本步骤中,将针对上一步骤得到的至少一个第二类变量组或者说弱变量组,分别构建风险评估模型,分别得到每个弱变量组的风险评估模型的模型结果。假设用逻辑回归方法针对弱变量组分别进行建模。考虑到是弱变量组,可以适当放宽变量入选标准。
例如,即时通信对应的弱变量组B的建模结果如下:
Figure BDA0000919885730000101
公式(3)中,LogoddsB为模型结果,f(xB)表示对变量组B建模,xBi表示变量组B的第i个变量,i为正整数,a0为截距项/常数项,ai表示变量xBi的权重。
考虑表3中变量名的对应关系,式(3)可以写成:
Figure BDA0000919885730000102
公式(4)中,LogoddsB为模型结果,f(xB)表示对变量组B建模,a0为截距项/常数项,ai表示变量xi的权重,i为正整数。
同理,可以得到社交对应的弱变量组C的建模结果:
Figure BDA0000919885730000103
公式(5)中,LogoddsC为模型结果,f(xC)表示对变量组C建模,xCi表示变量组C中的第i个变量,i为正整数,a0为截距项/常数项,ai表示变量xCi的权重。
Figure BDA0000919885730000111
公式(6)中,LogoddsC为模型结果,f(xC)表示对变量组C建模,a0为截距项/常数项,ai表示变量xi的权重,i为正整数。
需要说明的是,以上公式表示的风险评估模型仅为示例,并不用于限制本发明。
130、将每个第二类变量组的模型结果分别作为一个变量,与至少一个第一类变量组中的全部全量合并,组成第三类变量组;针对所述第三类变量组构建风险评估综合模型。
本步骤中,将每一个弱变量组的模型结果作为一个变量,将所有强变量组中的所有变量和所有模型结果变量合并,组成第三类变量组,本文中也将第三类变量组称为联合变量组。假设记至少一个弱变量组中的任一弱变量组Xj的风险评估模型的模型结果为Logoddsj,并将Logoddsj作为一个变量,记至少一个强变量组中的任一变量为xi,可将所有变量Logoddsj与xi合并组成联合变量组;其中,i和j均为正整数。联合变量组可表示为[x1,x2......xi......xn......Logoddsj......Logoddsm],其中,n为变量xi的个数,m为变量Logoddsj的个数,n和m均为正整数。
本步骤中,针对该联合变量组构建风险评估综合模型:
Figure BDA0000919885730000112
其中,a0为截距项/常数项,ai表示变量xi的权重,aj表示变量Logoddsj的权重。
假设变量Logoddsj有两个,即上一步骤得到的LogoddsB和LogoddsC,则公式(7)表示的综合模型可写为:
Figure BDA0000919885730000121
进一步的,还可以基于上述综合模型的模型结果Logodds计算概率参数Probability,公式如下:
Probability=exp(Logodds)/(1+exp(Logodds)) (9)
其中,exp()是以自然常数e为底的指数函数,Probability表示所述模型结果变坏的概率。假设计算得到Probability等于0.1,则说明模型结果有百分之十的概率变坏。
由上可见,本发明实例技术方案中,从方法论上来解决现有技术的问题:
(1)首先根据数据源及其与目标变量(例如金融风险)的相关性,与用户信息(例如资金信息)的相关性,把变量进行分组和分类,得到强变量组和弱变量组,比如1个强变量组和2个弱变量组;
(2)对弱变量组分别建模,例如针对2个弱变量组构建2个模型;
(3)把两个弱变量组的建模结果作为两个变量,和强变量组的变量放在一起,构建最终的风险评估综合模型。
通过这种方法,弱变量组中会有较多变量进入模型,从而保证了弱变量组的贡献;并且,模型在业务上具有更强可解释性,在实践应用中也更具鲁棒性。
为便于更好的理解本发明实施例提供的技术方案,下面结合附图说明风险评分卡的整个建模过程。如图2所示,是采用传统模型法例如逻辑回归法构建模型的过程。如图3所示,是采用本发明实施例风险评估方法构建模型的过程。从图2和图3中可以看出,本发明实施例的建模过程增加了“变量分组”和“弱变量组建模”两个过程。
实践中,本发明发明人对逻辑回归法、专家评分卡方法和本发明方法三种方法的结果进行了验证对比,对比结果如表3所示。
表4验证结果对比
Figure BDA0000919885730000122
Figure BDA0000919885730000131
KS是最常用到的用来衡量模型好坏的指标之一,模型在实施中的效果则是考量模型好坏的终极标准。表4显示,本发明实施例方法的模型训练效果和实施效果上都要略好于逻辑回归法,更优于专家评分卡。
可以理解,本发明实施例上述方案例如可以在计算机设备具体实施。
由上可见,在本发明的一些可行的实施方式中,提供了一种风险评估方法,采用对变量分组和分类,得到强变量组和弱变量组,针对得到的每个弱变量组分别构建风险评估模型,将每个弱变量组的模型结果作为一个变量,与得到的强变量组合并,组成联合变量组,最后针对该联合变量组构建风险评估综合模型的技术方案,取得了以下技术效果:
该方法充分的挖掘和利用了弱变量组的数据价值,各个弱变量组中的各个变量可以通过所对应的模型结果变量反映在最终构建的综合模型中,使得综合模型的模型结果能够体现各个弱变量组中的各个变量的作用,从而使风险评估考量因素更全面,解释性更强,模型稳定性更强,模型结果尽量客观,应用中也更具鲁棒性,有助于提高风险评估效果,有助于反映业务发展的未来趋势。
(实施例二、)为了更好的实施本发明实施例的上述方案,下面还提供用于配合实施上述方案的相关装置。
请参考图4,本发明实施例提供一种风险评估系统400,可包括:
预处理模块410,用于根据数据源与目标变量的相关性和/或数据源与用户信息的相关性,进行变量分组,得到至少一个第一类变量组和至少一个第二类变量组;
第一构建模块420,用于针对所述至少一个第二类变量组分别构建风险评估模型,分别得到每个第二类变量组的风险评估模型的模型结果;
变量组合模块430,用于将每个第二类变量组的模型结果作为一个变量,与所述至少一个第一类变量组中的全部全量合并,组成第三类变量组;
第二构建模块440,用于针对所述联合变量组构建风险评估综合模型。
在一些实施例中,所述预处理模块410包括:
分组单元4101,用于根据数据源的不同,将所有变量分为多个变量组;
计算单元4102,用于根据数据源与目标变量的相关性,计算任一个变量与目标变量的相关系数,并计算所述多个变量组的平均相关系数;
确定单元4103,用于根据数据源与用户信息的相关性,确定所述多个变量组的重要程度值;
分类单元4104,用于根据所述多个变量组的平均相关系数和/或重要程度值进行变量分类,将所述平均相关系数大于阈值和/或重要程度值最高的变量组分类为强变量组,将其它变量组分类为弱变量组。
在一些实施例中,所述变量组合模块430,具体用于:记所述至少一个第二类变量组中的任一变量组Xj的风险评估模型的模型结果为Logoddsj,并将Logoddsj作为一个变量,记所述至少一个第一类变量组中的任一变量为xi,将所有Logoddsj与xi合并组成第三类变量组;其中,i和j均为正整数。
在一些实施例中,所述第二构建模块440,具体用于:针对所述联合变量组构建如下风险评估综合模型:
Figure BDA0000919885730000141
其中,n为变量xi的个数,m为变量Logoddsj的个数,a0为截距项/常数项,ai表示变量xi的权重,aj表示变量Logoddsj的权重。
在一些实施例中,系统400还包括:计算模块450,用于根据所述第二逻辑模型的模型结果Logodds计算概率参数Probability,
Probability=exp(Logodds)/(1+exp(Logodds))
其中,Probability表示所述模型结果变坏的概率。
可以理解,本发明实施例的系统的各个功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可参照上述方法实施例中的相关描述,此处不再赘述。
由上可见,在本发明的一些可行的实施方式中,提供了一种风险评估系统,采用对变量分组和分类,得到强变量组和弱变量组,针对得到的每个弱变量组分别构建风险评估模型,将每个弱变量组的模型结果作为一个变量,与得到的强变量组合并,组成联合变量组,最后针对该联合变量组构建风险评估综合模型的技术方案,取得了以下技术效果:
该方法充分的挖掘和利用了弱变量组的数据价值,各个弱变量组中的各个变量可以通过所对应的模型结果变量反映在最终构建的综合模型中,使得综合模型的模型结果能够体现各个弱变量组中的各个变量的作用,从而使风险评估考量因素更全面,解释性更强,模型稳定性更强,模型结果尽量客观,应用中也更具鲁棒性,有助于提高风险评估效果,有助于反映业务发展的未来趋势。
(实施例三、)本发明实施例还提供一种计算机存储介质,该计算机存储介质可存储有程序,该程序被包括处理器的计算机设备执行时,使所述计算机设备执行如上述方法实施例中记载的风险评估方法的部分或全部步骤。
(实施例四、)请参考图5,本发明一个实施例还提供一种计算机设备500;
所述计算机设备500包括处理器501、存储器502、总线503和通信接口504;所述存储器502用于存储程序505,所述程序505包括计算机执行指令,所述处理器501与所述存储器502通过所述总线503连接,当所述计算机设备500运行时,所述处理器501执行所述存储器502存储的所述程序505,以使所述计算机设备500执行如上述方法实施例中记载的风险评估方法。
具体的,所述通信接口504可以接收数据,接收到的数据包括所有变量,所述存储器502可以存储接收到的变量,所述处理器501可以通过执行程序505执行以下步骤:根据数据源与目标变量的相关性和/或数据源与用户信息的相关性,进行变量分组,得到至少一个第一类变量组和至少一个第二类变量组;针对所述至少一个第二类变量组分别构建风险评估模型,得到每个第二类变量组的风险评估模型的模型结果;将每个第二类变量组的模型结果作为一个变量,与所述至少一个第一类变量组中的全部全量合并,组成第三类变量组;针对所述第三类变量组构建风险评估综合模型。
其中,所述总线503可以是工业标准体系结构(Industry StandardArchitecture,简称为ISA)总线或外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称为EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线中的一种或多种。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
所述存储器502可以包含高速RAM(Ramdom Access Memory)存储器。可选地,所述存储器502还可以还包括非易失性存储器(non-volatile memory)。例如所述存储器502可以包括磁盘存储器。
所述处理器501可以是一个中央处理器(Central Processing Unit,简称为CPU),或者所述处理器501可以是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者所述处理器501可以是被配置成实施本发明实施例的一个或多个集成电路。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
以上对本发明实施例所提供的风险评估方法和系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种风险评估方法,其特征在于,包括:
计算机设备根据数据源与目标变量的相关性和/或数据源与用户信息的相关性,进行变量分组,得到至少一个第一类变量组和至少一个第二类变量组;所述数据源包括支付、即时通信和社交中的至少两种,当所述数据源为支付时,所述变量包括信用卡还款信息、资金规模、用户交易的频率和用户电话卡充值中的至少一种;当所述数据源为即时通信时,所述变量包括常用登陆城市个数和收发信息条数中的至少一种;当所述数据源为社交时,所述变量包括粘性较高的好友数量、好友质量、好友的个数和收发信息量中的至少一种;所述目标变量包括违约信息,所述用户信息包括资金信息;所述第一类变量组为与所述目标变量的相关性较高和/或与所述用户信息的相关性较高的强变量组;所述第二类变量组为与所述目标变量的相关性较低和/或与所述用户信息的相关性较低的弱变量组;
所述计算机设备针对所述至少一个第二类变量组分别构建风险评估模型,得到每个第二类变量组的风险评估模型的模型结果;
所述计算机设备将每个第二类变量组的模型结果作为一个变量,与所述至少一个第一类变量组中的全部全量合并,组成第三类变量组;
所述计算机设备针对所述第三类变量组构建风险评估综合模型。
2.根据权利要求1所述的方法,其特征在于,所述计算机设备根据数据源与目标变量的相关性和/或数据源与用户信息的相关性,进行变量组分组,得到至少一个第一类变量组和至少一个第二类变量组包括:
所述计算机设备根据数据源的不同,将所有变量分为多个变量组;
所述计算机设备根据数据源与目标变量的相关性,计算任一个变量与目标变量的相关系数,并计算所述多个变量组中每个变量组的平均相关系数;
所述计算机设备根据数据源与用户信息的相关性,确定所述多个变量组中每个变量组的重要程度值;
所述计算机设备根据所述多个变量组的平均相关系数和/或重要程度值进行变量组分类,将所述平均相关系数大于阈值和/或重要程度值最高的变量组分类为第一类变量组,将其它变量组分类为第二类变量组。
3.根据权利要求1或2所述的方法,其特征在于,所述计算机设备将每个第二类变量组的模型结果作为一个变量,与所述至少一个第一类变量组中的全部全量合并,组成第三类变量组包括:
所述计算机设备记所述至少一个第二类变量组中的任一变量组Xj的风险评估模型的模型结果为Logoddsj,并将Logoddsj作为一个变量,记所述至少一个第一类变量组中的任一变量为xi,将所有Logoddsj与xi合并组成第三类变量组;其中,i和j均为正整数。
4.根据权利要求3所述的方法,其特征在于,所述计算机设备针对所述第三类变量组构建风险评估综合模型包括:
计算机设备针对所述第三类变量组构建如下风险评估综合模型:
Figure FDA0003018813400000021
其中,n为变量xi的个数,m为变量Logoddsj的个数,a0为截距项/常数项,ai表示变量xi的权重,aj表示变量Logoddsj的权重。
5.根据权利要求4所述的方法,其特征在于,还包括:
计算机设备根据所述风险评估综合模型的模型结果Logodds计算概率参数Probability,
Probability=exp(Logodds)/(1+exp(Logodds))
其中,Probability表示所述风险评估综合模型的模型结果变坏的概率。
6.一种风险评估系统,其特征在于,所述系统设置于计算机设备,包括:
预处理模块,用于根据数据源与目标变量的相关性和/或数据源与用户信息的相关性,进行变量分组,得到至少一个第一类变量组和至少一个第二类变量组;所述数据源包括支付、即时通信和社交中的至少两种,当所述数据源为支付时,所述变量包括信用卡还款信息、资金规模、用户交易的频率和用户电话卡充值中的至少一种;当所述数据源为即时通信时,所述变量包括常用登陆城市个数和收发信息条数中的至少一种;当所述数据源为社交时,所述变量包括粘性较高的好友数量、好友质量、好友的个数和收发信息量中的至少一种;所述目标变量包括违约信息,所述用户信息包括资金信息;所述第一类变量组为与所述目标变量的相关性较高和/或与所述用户信息的相关性较高的强变量组;所述第二类变量组为与所述目标变量的相关性较低和/或与所述用户信息的相关性较低的弱变量组;
第一构建模块,用于针对所述至少一个第二类变量组分别构建风险评估模型,得到每个第二类变量组的风险评估模型的模型结果;
变量组合模块,用于将每个第二类变量组的模型结果作为一个变量,与所述至少一个第一类变量组中的全部全量合并,组成第三类变量组;
第二构建模块,用于针对所述第三类变量组构建风险评估综合模型。
7.根据权利要求6所述的系统,其特征在于,所述预处理模块包括:
分组单元,用于根据数据源的不同,将所有变量分为多个变量组;
计算单元,用于根据数据源与目标变量的相关性,计算任一个变量与目标变量的相关系数,并计算所述多个变量组的平均相关系数;
确定单元,用于根据数据源与用户信息的相关性,确定所述多个变量组的重要程度值;
分类单元,用于根据所述多个变量组的平均相关系数和/或重要程度值进行变量分类,将所述平均相关系数大于阈值和/或重要程度值最高的变量组分类为强变量组,将其它变量组分类为弱变量组。
8.根据权利要求6或7所述的系统,其特征在于,
所述变量组合模块,具体用于:记所述至少一个第二类变量组中的任一变量组Xj的风险评估模型的模型结果为Logoddsj,并将Logoddsj作为一个变量,记所述至少一个第一类变量组中的任一变量为xi,将所有Logoddsj与xi合并组成第三类变量组;其中,i和j均为正整数。
9.根据权利要求8所述的系统,其特征在于,
所述第二构建模块,具体用于:针对所述第三类变量组构建如下风险评估综合模型:
Figure FDA0003018813400000031
其中,n为变量xi的个数,m为变量Logoddsj的个数,a0为截距项/常数项,ai表示变量xi的权重,aj表示变量Logoddsj的权重。
10.根据权利要求9所述的系统,其特征在于,还包括:
计算模块,用于根据所述风险评估综合模型的模型结果Logodds计算概率参数Probability,
Probability=exp(Logodds)/(1+exp(Logodds))
其中,Probability表示所述模型结果变坏的概率。
11.一种存储介质,其特征在于,所述存储介质中存储有程序,所述程序由处理器加载并执行以实现如权利要求1至5任一所述的风险评估方法。
12.一种计算机设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有程序,所述程序由所述处理器加载并执行以实现如权利要求1至5任一所述的风险评估方法。
CN201610070616.5A 2016-02-01 2016-02-01 一种风险评估方法和系统 Active CN107025596B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201610070616.5A CN107025596B (zh) 2016-02-01 2016-02-01 一种风险评估方法和系统
PCT/CN2017/071920 WO2017133492A1 (zh) 2016-02-01 2017-01-20 一种风险评估方法和系统
EP17746812.1A EP3413221A4 (en) 2016-02-01 2017-01-20 RISK ASSESSMENT PROCESS AND SYSTEM
KR1020187007365A KR102061987B1 (ko) 2016-02-01 2017-01-20 위험 평가 방법 및 시스템
JP2018513514A JP6771751B2 (ja) 2016-02-01 2017-01-20 リスク評価方法およびシステム
US16/024,159 US20180308160A1 (en) 2016-02-01 2018-06-29 Risk assessment method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610070616.5A CN107025596B (zh) 2016-02-01 2016-02-01 一种风险评估方法和系统

Publications (2)

Publication Number Publication Date
CN107025596A CN107025596A (zh) 2017-08-08
CN107025596B true CN107025596B (zh) 2021-07-16

Family

ID=59499353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610070616.5A Active CN107025596B (zh) 2016-02-01 2016-02-01 一种风险评估方法和系统

Country Status (6)

Country Link
US (1) US20180308160A1 (zh)
EP (1) EP3413221A4 (zh)
JP (1) JP6771751B2 (zh)
KR (1) KR102061987B1 (zh)
CN (1) CN107025596B (zh)
WO (1) WO2017133492A1 (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10924479B2 (en) * 2016-07-20 2021-02-16 Aetna Inc. System and methods to establish user profile using multiple channels
US10404735B2 (en) * 2017-02-02 2019-09-03 Aetna Inc. Individualized cybersecurity risk detection using multiple attributes
KR20190119082A (ko) * 2017-02-17 2019-10-21 애큐웨더 아이엔씨. 기상 데이터의 통계 분석을 사용하여 경제 동향들을 예측하기 위한 시스템 및 방법
US11144940B2 (en) * 2017-08-16 2021-10-12 Benjamin Jack Flora Methods and apparatus to generate highly-interactive predictive models based on ensemble models
CN107730096A (zh) * 2017-09-29 2018-02-23 北京神州绿盟信息安全科技股份有限公司 一种情报数据源的质量评估方法及装置
CN107957982B (zh) * 2017-12-05 2020-11-20 中国科学院遥感与数字地球研究所 震后次生地质灾害易发性快速评估方法和系统
CN108596415B (zh) 2017-12-15 2023-11-24 创新先进技术有限公司 一种模型整合方法及装置
CN108416669A (zh) * 2018-03-13 2018-08-17 腾讯科技(深圳)有限公司 用户行为数据处理方法、装置、电子设备及计算机可读介质
CN110400208B (zh) * 2018-04-25 2021-03-12 上海方付通商务服务有限公司 一种小微风险控制模型构建方法及应用方法
CN108805692B (zh) * 2018-04-27 2021-05-28 重庆小雨点小额贷款有限公司 一种变量选择方法、装置及服务器
US10769006B2 (en) 2018-07-31 2020-09-08 Cisco Technology, Inc. Ensemble risk assessment method for networked devices
KR102203705B1 (ko) * 2018-08-21 2021-01-15 아주대학교산학협력단 연속형 변수의 계층화 그룹핑 방법 및 이를 이용한 상관관계 분석 방법 및 그 장치
KR102203711B1 (ko) * 2018-08-28 2021-01-15 아주대학교산학협력단 연속형 변수의 보정 방법 및 이를 이용한 상관관계 분석 방법 및 그 장치
CN109346168A (zh) * 2018-08-31 2019-02-15 东软集团股份有限公司 一种确定数据相关性的方法及装置
CN109377083A (zh) * 2018-11-14 2019-02-22 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 风险评估方法、装置、设备和存储介质
CN109727120A (zh) * 2018-12-14 2019-05-07 深圳壹账通智能科技有限公司 风险评估模型的测试方法及装置、存储介质、计算机设备
CN109961362A (zh) * 2019-02-19 2019-07-02 合肥工业大学 P2p平台信用风险动态评价方法和系统
CN110310129B (zh) * 2019-06-04 2023-08-04 创新先进技术有限公司 风险识别方法及其系统
CN110503566B (zh) * 2019-07-08 2024-02-09 中国平安人寿保险股份有限公司 风控模型建立方法、装置、计算机设备及存储介质
CN110490749A (zh) * 2019-07-23 2019-11-22 平安科技(深圳)有限公司 一种产品定价方法及装置
CN110413901B (zh) * 2019-08-02 2023-05-26 深圳索信达数据技术有限公司 一种基于社交网络分析的信用风险评估方法
CN110688400A (zh) * 2019-09-02 2020-01-14 深圳壹账通智能科技有限公司 数据处理方法、装置、计算机设备和存储介质
CN110751400B (zh) * 2019-10-22 2022-08-02 宜人恒业科技发展(北京)有限公司 一种风险评估方法及装置
CN111079941B (zh) * 2019-12-03 2024-02-20 武汉纺织大学 信用信息处理方法、系统、终端和存储介质
CN111178756B (zh) * 2019-12-29 2024-02-27 杭州拓深科技有限公司 一种基于环境大数据的多元线性回归火灾风险评估方法
CN111430030A (zh) * 2020-04-17 2020-07-17 武汉大学 生物标志物在卵巢癌评估中的应用方法及系统
CN111415247B (zh) * 2020-04-25 2023-07-28 中信银行股份有限公司 贷后信用风险评价方法、装置、存储介质及电子设备
JP7396213B2 (ja) 2020-06-22 2023-12-12 Tdk株式会社 データ解析システム、データ解析方法及びデータ解析プログラム
KR102329428B1 (ko) * 2020-07-22 2021-11-24 주식회사 업데이터 딥러닝을 활용한 건물단위 화재 위험도 예측 장치 및 이를 이용한 방법
CN112365165A (zh) * 2020-11-13 2021-02-12 广东卓志跨境电商供应链服务有限公司 一种跨境电商风控管理方法及系统
CN112581000A (zh) * 2020-12-24 2021-03-30 广东省电信规划设计院有限公司 企业风险指数计算方法及装置
CN113129126B (zh) * 2021-04-15 2023-04-25 算话智能科技有限公司 一种业务数据处理方法及装置
CN114240097A (zh) * 2021-12-02 2022-03-25 支付宝(杭州)信息技术有限公司 一种风险评估的方法及装置
KR20230087097A (ko) * 2021-12-09 2023-06-16 주식회사 카카오뱅크 2단계의 로지스틱 회귀분석을 이용한 신용평가모델 운영 방법
CN115396161A (zh) * 2022-08-10 2022-11-25 中国第一汽车股份有限公司 车辆网络安全的评估方法、装置以及云服务器

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131763A (zh) * 2007-09-27 2008-02-27 中国工商银行股份有限公司 一种基于web的银行信用风险检测方法与系统
CN102117469A (zh) * 2011-01-18 2011-07-06 中国工商银行股份有限公司 一种对信用风险进行评估的系统和方法
CN102663643A (zh) * 2012-03-16 2012-09-12 暨南大学 一种农户多层单向网络线性分段信用评级方法
CN103854063A (zh) * 2012-11-29 2014-06-11 中国科学院计算机网络信息中心 一种基于互联网开放信息的事件发生风险预测并预警方法
CN104463673A (zh) * 2014-12-22 2015-03-25 中国科学技术大学苏州研究院 一种基于支持向量机的p2p网络贷款风险评估模型
CN104679939A (zh) * 2015-01-26 2015-06-03 北京航空航天大学 一种飞机设计经济可承受性评估过程的多准则决策方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1266305A2 (en) 1999-09-02 2002-12-18 Children's Medical Center Corporation A system and method for mining data from a database using relevance networks
WO2001063445A2 (en) 2000-02-22 2001-08-30 Eqe International, Inc. Comprehensive risk assessment system and autonomous methods of insurance underwriting utilizing same
US20040249678A1 (en) * 2003-06-03 2004-12-09 Henderson E. Devere Systems and methods for qualifying expected risk due to contingent destructive human activities
WO2007005975A2 (en) * 2005-07-01 2007-01-11 Valen Technologies, Inc. Risk modeling system
US7889318B2 (en) * 2007-09-19 2011-02-15 Asml Netherlands B.V. Methods of characterizing similarity between measurements on entities, computer programs product and data carrier
US8095498B2 (en) * 2008-12-17 2012-01-10 International Business Machines Corporation Data mining model interpretation, optimization, and customization using statistical techniques
US8190612B2 (en) * 2008-12-17 2012-05-29 Sas Institute Inc. Computer-implemented systems and methods for variable clustering in large data sets
WO2011057217A2 (en) * 2009-11-06 2011-05-12 University Of Utah Research Foundation Method for gathering, processing, and analyzing data to determine crash risk associated with driving behavior
US8489499B2 (en) * 2010-01-13 2013-07-16 Corelogic Solutions, Llc System and method of detecting and assessing multiple types of risks related to mortgage lending
JP5603827B2 (ja) * 2010-05-18 2014-10-08 トヨタテクニカルディベロップメント株式会社 制御因子特定用回帰式の生成方法
US20120078681A1 (en) 2010-09-24 2012-03-29 Fair Isaac Corporation Multi-hierarchical customer and product profiling for enhanced retail offerings
TWI451336B (zh) * 2011-12-20 2014-09-01 Univ Nat Cheng Kung 預測模型之建模樣本的篩選方法及其電腦程式產品
JP5794160B2 (ja) * 2012-01-26 2015-10-14 富士通株式会社 説明変数の決定のための情報処理装置、情報処理方法及びプログラム
US20140365350A1 (en) * 2013-06-10 2014-12-11 Rawllin International Inc. Financial platform that facilitates management of financial services
US20150262289A1 (en) * 2014-03-14 2015-09-17 Dean S. Hettesheimer Method of Producing a Lifestyle Evaluation Report from User Attribute and Behavior Data by Executing Computer-Executable Instructions Stored On a Non-Transitory Computer-Readable Medium
US20170103148A1 (en) * 2014-03-27 2017-04-13 Nec Corporation System-analyzing device, analysis-model generation method, system analysis method, and system-analyzing program
US20150324922A1 (en) * 2014-05-07 2015-11-12 Guy Carpenter & Company, Llc System and method for simulating the operational claims response to a catastrophic event
CN105243474A (zh) * 2015-09-24 2016-01-13 浙江省安全生产科学研究院 基于时空信息的尾矿库安全风险评估方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131763A (zh) * 2007-09-27 2008-02-27 中国工商银行股份有限公司 一种基于web的银行信用风险检测方法与系统
CN102117469A (zh) * 2011-01-18 2011-07-06 中国工商银行股份有限公司 一种对信用风险进行评估的系统和方法
CN102663643A (zh) * 2012-03-16 2012-09-12 暨南大学 一种农户多层单向网络线性分段信用评级方法
CN103854063A (zh) * 2012-11-29 2014-06-11 中国科学院计算机网络信息中心 一种基于互联网开放信息的事件发生风险预测并预警方法
CN104463673A (zh) * 2014-12-22 2015-03-25 中国科学技术大学苏州研究院 一种基于支持向量机的p2p网络贷款风险评估模型
CN104679939A (zh) * 2015-01-26 2015-06-03 北京航空航天大学 一种飞机设计经济可承受性评估过程的多准则决策方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于支持向量机的农户信用评价研究;程鑫;《中国博士学位论文全文数据库 经济与管理科学辑》;20150915(第09(2015)期);第J159-11页 *
惩罚变量选择方法比较分析及其在信用卡信用风险中的应用;姜叶飞;《中国优秀硕士学位论文全文数据库 经济与管理科学辑》;20140915(第09(2014)期);第J145-166页 *

Also Published As

Publication number Publication date
EP3413221A1 (en) 2018-12-12
US20180308160A1 (en) 2018-10-25
JP6771751B2 (ja) 2020-10-21
KR102061987B1 (ko) 2020-01-02
JP2018538587A (ja) 2018-12-27
CN107025596A (zh) 2017-08-08
WO2017133492A1 (zh) 2017-08-10
KR20180041174A (ko) 2018-04-23
EP3413221A4 (en) 2019-08-07

Similar Documents

Publication Publication Date Title
CN107025596B (zh) 一种风险评估方法和系统
US10943186B2 (en) Machine learning model training method and device, and electronic device
US10783457B2 (en) Method for determining risk preference of user, information recommendation method, and apparatus
US20200090268A1 (en) Method and apparatus for determining level of risk of user, and computer device
CN111507831A (zh) 信贷风险自动评估方法和装置
CN110909984B (zh) 业务数据处理模型训练方法、业务数据处理方法及装置
CN112734559B (zh) 企业信用风险评价方法、装置及电子设备
CN108898476A (zh) 一种贷款客户信用评分方法和装置
US11250368B1 (en) Business prediction method and apparatus
CN113095927B (zh) 一种反洗钱可疑交易识别方法及设备
CN113139687B (zh) 一种预测信用卡用户违约的方法及装置
CN112750029A (zh) 信用风险预测方法、装置、电子设备及存储介质
CN115293336A (zh) 风险评估模型训练方法、装置和服务器
CN112434862B (zh) 上市企业财务困境预测方法及装置
CN110795537B (zh) 一种确定目标商品的改进策略的方法、装置、设备和介质
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN114626940A (zh) 数据分析方法、装置及电子设备
CN114170000A (zh) 信用卡用户风险类别识别方法、装置、计算机设备和介质
CN113240259A (zh) 规则策略组的生成方法、系统及电子设备
CN112115258A (zh) 一种用户的信用评价方法、装置、服务器及存储介质
CN117994017A (zh) 构建零售信用风险预测模型的方法和线上信贷业务Scoredelta模型
CN118071482A (zh) 构建零售信用风险预测模型的方法和消费信贷业务Scorebetad模型
CN114444592A (zh) 特征筛选方法、设备、存储介质及程序产品
CN117994016A (zh) 构建零售信用风险预测模型的方法和消费信贷业务Scorebeta模型
CN117974290A (zh) 决策树和逻辑回归的信用评分卡开发、评分方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant