CN110599329A - 信用评估方法、信用评估装置及电子设备 - Google Patents
信用评估方法、信用评估装置及电子设备 Download PDFInfo
- Publication number
- CN110599329A CN110599329A CN201910849709.1A CN201910849709A CN110599329A CN 110599329 A CN110599329 A CN 110599329A CN 201910849709 A CN201910849709 A CN 201910849709A CN 110599329 A CN110599329 A CN 110599329A
- Authority
- CN
- China
- Prior art keywords
- applicant
- social
- credit
- nodes
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 67
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 26
- 238000013210 evaluation model Methods 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 14
- 238000007477 logistic regression Methods 0.000 claims description 13
- 238000012546 transfer Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 19
- 238000012549 training Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 238000004590 computer program Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000005295 random walk Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000009193 crawling Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请提供一种信用评估方法、信用评估装置及电子设备,属于互联网技术领域。该信用评估方法可以包括:基于申请者的社交数据,构建所述申请者的社交关系网络;利用Node2Vec算法,从所述社交关系网络提取所述申请者的社交属性特征;将所述社交属性特征应用于信用评估模型,以得到对所述申请者的信用评估结果。本申请的实施例有效提升申请者信用评估的效率和准确率。
Description
技术领域
本申请涉及互联网技术领域,具体而言,涉及一种信用评估方法、信用评估装置及电子设备。
背景技术
信用评估是对信用主体的信用情况进行评估的活动。例如,在银行、小额贷款公司、消费金融公司等金融机构的贷款审批和信用卡审批过程中,为了尽可能避免坏账率等不良业务,需要对申请者的信用进行评估。
现有的一种信用评估方式是通过评分模型,通过人工设计申请者的特征进行评估,评估主观性强,无法做到经验批量复制,且模型开发工作量较大,导致信用评估准确性、评估效率较低。
发明内容
本申请实施例的目的在于提供一种信用评估方法及装置,其能够有效提升申请者信用评估的效率和准确率。
根据本申请的一个实施例,一种信用评估方法可以包括:基于申请者的社交数据,构建所述申请者的社交关系网络;利用Node2Vec算法,从所述社交关系网络提取所述申请者的社交属性特征;将所述社交属性特征应用于信用评估模型,以得到对所述申请者的信用评估结果。
根据本申请的另一实施例,一种信用评估装置可以包括:构建模块,用于基于申请者的社交数据,构建所述申请者的社交关系网络;提取模块,用于利用Node2Vec算法,从所述社交关系网络提取所述申请者的社交属性特征;评估模块,用于将所述社交属性特征应用于信用评估模型,以得到对所述申请者的信用评估结果。
在本申请的一些实施例中,所述提取模块还被配置成:将所述社交关系网络代入Node2Vec算法,以得到所述申请者的n维社交属性特征(X1,X2,…,Xn),其中每一维特征Xk表示所述申请者的特定社交属性,n为大于2的整数,且k=1,2,…,n。
在本申请的一些实施例中,所述评估模块还被配置成:将所述n维社交属性特征(X1,X2,…,Xn)应用于逻辑回归LR信用评估模型,以为每一维特征Xk生成相应的权重系数Ak,并根据下式计算所述申请者的违约概率P:P=Sigmoid(A1*X1+A2*X2+…+An*Xn)。
在本申请的一些实施例中,所述评估模块还被配置成:根据下式将所述违约概率P转换成所述申请者的信用分数S:
S1=650+50*((ln((1-P)/P)-ln(50))/ln(2)),
S=MIN(MAX(S1,300),850)。
在本申请的一些实施例中,还包括爬取模块被配置成:在构建所述申请者的社交关系网络之前,从社交网络服务器获取所述申请者的好友数据以及所述申请者及其各个好友相互之间的联络数据作为所述社交数据。
在本申请的一些实施例中,所述构建模块还被配置成:将所述申请者及其各个好友分别表示为所述社交关系网络的多个节点;基于所述联络数据,形成所述多个节点中相应节点之间的连接边。
在本申请的一些实施例中,所述构建模块还被配置成:根据所述相应节点之间的转账金额或通信次数中的至少一种,形成所述连接边。
在本申请的一些实施例中,所述评估模块还被配置成:将所述社交属性特征连同所述申请者的历史还款记录一起应用于所述信用评估模型,以得到所述信用评估结果。
在本申请的一些实施例中,在将所述社交属性特征应用于信用评估模型,以得到对所述申请者的信用评估结果之后,如果所述信用评估结果属于评估通过,根据所述申请者的申请业务相关信息完成业务操作;将完成所述申请业务的操作记录数据加密共享至业务区块链的相关节点,以使得相关节点验证该记录数据后存入区块。
根据本申请的另一实施例,提供了一种存储介质,其上存储有指令程序,所述指令程序在被处理器执行时实现上述的信用评估方法。
根据本申请的另一实施例,一种电子设备可以包括处理器和存储器,所述存储器中存储有指令程序,所述指令程序在由所述处理器执行时实现上述的信用评估方法。
根据本申请的实施例,能够有效提升申请者信用评估的效率和准确率。
本申请的其他特征和优点将通过下面结合附图的详细描述变得显然,或部分地通过本申请的实践而习得。
应当理解,以上的一般描述和后文的详细描述仅是示例性和解释性的,并不旨在限制本申请。
附图说明
图1示出了可以应用本申请实施例的系统的示意图。
图2示出了本申请实施例提供的分布式系统应用于区块链系统的一个可选的结构示意图。
图3示出了根据本申请的一个实施例的信用评估方法的流程图。
图4示出了根据本申请的一个实施例的利用提取社交属性特征的示意图。
图5示意性示出了根据本申请的一个实施例的信用评估装置的框图。
图6示意性示出了根据本申请的一个实施例的电子设备的框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了可以应用本申请实施例的系统100的示意图。
如图1所示,系统100可以包括终端设备101、网络102、服务器103和服务器104。终端设备101与服务器103和服务器104可以通过网络102进行通信。网络102可以是有线网络、无线网络等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器103和服务器104可以是多个服务器组成的服务器集群等。
申请者可以使用终端设备101通过网络102与服务器103和服务器104交互,以接收或发送消息等。终端设备101可以为具有计算处理能力的各种设备,包括但不限于个人计算机、手机等。
在本申请的一个具体应用场景中,申请者可以使用终端设备101通过网络102向服务器104发送业务申请请求(如贷款业务申请),以便从服务器104从服务器104获取申请者的社交数据。
在本申请的一个实施例中,服务器104可以基于申请者的社交数据,构建该申请者的社交关系网络;利用Node2Vec算法,从该社交关系网络提取该申请者的社交属性特征;将该社交属性特征应用于信用评估模型,以得到对该申请者的信用评估结果。
在本申请的一个实施例中,服务器104还可以在构建所述申请者的社交关系网络之前,从社交网络服务器获取所述申请者的好友数据以及所述申请者及其各个好友相互之间的联络数据作为所述社交数据。
可替换地,上述由服务器执行的操作也可以由终端设备执行。
本申请实施例的系统100可以是由多个节点(接入网络中的任意形式的计算设备,如终端设备101、服务器103和服务器104)通过网络通信的形式连接形成的分布式系统。
以分布式系统为区块链系统为例,参见图2,图2可以是本申请实施例提供的分布式系统100应用于区块链系统的一个可选的结构示意图,由多个节点形成,节点之间形成组成的点对点(P2P,Peer To Peer)网络,P2P协议是一个运行在传输控制协议(TCP,Transmission Control Protocol)协议之上的应用层协议。在分布式系统中,任何机器如服务器、终端都可以加入而成为节点,节点包括硬件层、中间层、操作系统层和应用层。
参见图2示出的区块链系统中各节点的功能可以包括:
路由,节点具有的基本功能,用于支持节点之间的通信。
节点除具有路由功能外,还可以具有以下功能:
应用,用于部署在区块链中,根据实际业务需求而实现特定业务(如申请者的贷款业务审核等),记录实现功能相关的数据形成记录数据,在记录数据中携带数字签名以表示任务数据的来源,将记录数据发送到区块链系统中的其他节点,供其他节点在验证记录数据来源以及完整性成功时,将记录数据添加到临时区块中。
应用实现的业务可以包括:例如,钱包,可以用于发起交易(例如,贷款交易等),即将当前交易的交易记录发送给区块链系统中的其他节点,其他节点验证成功后,作为承认交易有效的响应,将交易的记录数据存入区块链的临时区块中;当然,钱包还支持查询电子货币地址中剩余的电子货币;共享账本,用于提供账目数据的存储、查询和修改等操作的功能,将对账目数据的操作的记录数据发送到区块链系统中的其他节点,其他节点验证有效后,作为承认账目数据有效的响应,将记录数据存入临时区块中,还可以向发起操作的节点发送确认。智能合约,计算机化的协议,可以执行某个合约的条款,通过部署在共享账本上的用于在满足一定条件时而执行的代码实现,根据实际的业务需求代码用于完成自动化的交易;当然,智能合约不仅限于执行用于交易的合约,还可以执行对接收的信息进行处理的合约。
区块链,可以包括一系列按照产生的先后时间顺序相互接续的区块(Block),新区块一旦加入到区块链中就不会再被移除,区块中记录了区块链系统中节点提交的记录数据。其中,区块结构(Block Structure)中的每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值,各区块通过哈希值连接形成区块链。另外,区块中还可以包括有区块生成时的时间戳等信息。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了相关的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
在本申请的一个实施例中,服务器104还可以在将该社交属性特征应用于信用评估模型,以得到对该申请者的信用评估结果之后,如果所述信用评估结果属于评估通过,根据该申请者的申请业务相关信息完成业务操作;将完成该申请业务的操作记录数据加密共享至业务区块链的相关节点,以使得相关节点验证该记录数据后存入区块。
图3示意性示出了根据本申请的一个实施例的信用评估方法的流程图。该信用评估方法的执行主体可以是具有计算处理功能的电子设备,比如图1中所示的终端设备101或服务器104。如图3所示,该信用评估方法可以包括步骤S210至步骤S230。
在步骤S210中,基于申请者的社交数据,构建所述申请者的社交关系网络。
在本申请的一个实施例中,申请者的社交数据可以是申请者社交活动中产生的好友数据,例如,申请者的社交好友、资金转账好友、手机联系人等好友数据,以及申请者与好友的转账金额、通信次数等联络数据。社交数据可以由申请者在业务申请的时候自己填写,也可由第三方机构提供。可以理解,该申请者可以是任意具有社交网络关系的主体,例如人或者企业等。
在收集到申请者的社交数据之后,通过将申请者及其好友作为网络节点,好友之间的联络数据作为节点之间的连接边,构建出可以反映申请者与其好友之间的信用意识和观念相互影响关系的社交关系网络。该社交关系网络隐含了很多申请者的相关社交信息,网络节点的度可以反映申请者的社交广度,网络节点的数量可以反映申请者的社交强度。
在本申请的一个实施例中,在构建申请者的社交关系网络之前,从社交网络服务器获取申请者的好友数据以及申请者及其各个好友相互之间的联络数据作为社交数据。
社交网络服务器可以是记录有申请者及其好友的社交数据的至少一个服务器,例如,某社交软件平台的云服务器等。根据申请者的唯一标识信息(例如,用户身份证号或者企业税号等),可以从社交网络服务器爬取或者请求到申请者的好友数据以及申请者及其各个好友相互之间的联络数据。
在本申请的一个实施例中,构建申请者的社交关系网络包括:
将申请者及其各个好友分别表示为社交关系网络的多个节点;
基于联络数据,形成所述多个节点中相应节点之间的连接边。
申请者及其每个好友可以代表一个节点V;而申请者与好友的转账金额、通信次数等联络数据可以是节点之间的连接边E,进而可以构建一张申请者的社交关系网络G(V,E)。例如,对于申请者A及其好友B、C、...、H,可以表示为社交关系网络G(V,E)的8个节点,进而可以通过数组V[8]={V1,V2,...,V8}存储这些节点的信息,其中,V1,V2,...,V8可以依次对应表示A、B、C、...、H的信息;对于节点之间的连接边E,可以通过数组E[8][8]存储关系网络节点的连接边的信息,如E[2][3]可以存储V2与V3节点的联络数据,进而构造出申请者的社交关系网络G(V,E)。
在本申请的一个实施例中,形成多个节点中相应节点之间的连接边包括:根据相应节点之间的转账金额或通信次数中的至少一种,形成连接边。
相应节点可以是申请者及其好友中任意两个具有联络的节点,联络过程产生的转账金额或通信次数是对申请者社交过程中信用表现反映最明显的数据。进而,根据相应节点之间的转账金额或通信次数中的至少一种,形成连接边,可以保证社交关系网络包括申请者的强信用属性信息。
在步骤S220中,利用Node2Vec算法,从所述社交关系网络提取所述申请者的社交属性特征。
申请者的社交属性特征是提取的申请者各种社交属性的特征,例如,好友个数(节点的度)、入账数据等属性的特征。
Node2Vec算法可以综合考虑广度优先搜索邻域(考虑节点的结构相似性,例如,某节点同时属于两个不同的节点群)和深度优先搜索邻域(考虑节点之间的内容相似性,例如,两个节点的某个属性的信息相似),以每个节点作为起始节点,对近邻节点进行有偏地随机采样得到多个节点序列,映射成特征向量,反映出关系网络各种社交属性的特征。
其中,有偏的随机采样策略可以根据实际任务,通过训练的Node2Vec算法函数中的超参数p和q进行控制,p是控制访问走过的节点,即往回走;q是控制访问还没有走过的节点,即向外走。具体地,该函数中随机游走时,从一个节点ci-1到下一个节点ci的概率通过下式确定:
其中,πvx为节点之间为归一化概率,Z为所有下一个搜索到的节点的概率的和,wvx为节点V与X之间的边权,当随机游走经过连接边tv,到达节点v,从节点v到下一个节点x的概率:
πvx=αpq(t,x)·wvx,
其中,dtx为节点t与节点x之间的最短路径距离,p作用与dtx=0的情景,也就是节点x就是当前节点v之前访问过的节点,此时,p越高则访问刚刚访问过的节点的概率低,q大于1表示随机游走倾向于访问和t接近的节点,q小于1表示随机游走倾向于访问和t远离的节点。这样根据信用评估任务,对于不同任务需求的社交属性特征,通过半监督学习训练出p,q参数,例如某两个性质的节点偏向于访问刚刚访问过的节点的类型,则训练较小的p参数。进而可以根据信用评估业务提取相应的社交属性特征。
进而利用Node2Vec算法可以将社交关系网络隐藏的各种社交关系映射成二维矩阵,矩阵的每一维就代表一类社交特征,自动提取到申请者的社交属性特征。
在本申请的一个实施例中,提取所述申请者的社交属性特征包括:将所述社交关系网络代入Node2Vec算法,以得到所述申请者的n维社交属性特征(X1,X2,…,Xn),其中每一维特征Xk表示所述申请者的特定社交属性,n为大于2的整数,且k=1,2,…,n。
例如,如图4所示,对于基于申请者A,B,C,D,E,F,G,H及其好友构建出来的构建的社交关系网络,将该网络代入到Node2Vec算法之后便可得到网络中每个节点的n=8维社交属性特征(X1,X2,…,X8)。其中,每一维特征X1,X2,…,Xn都是申请者在某种意义上的社交属性特征(如第一维特征X1就很可能代表节点的度,节点的度越大,则该维特征的取值也就越大)。可以理解,运用Node2Vec算法可以生成更多维特征,如128维、256维特征,网络越大可生成的特征就越多。
在步骤S230中,将所述社交属性特征应用于信用评估模型,以得到对所述申请者的信用评估结果。
在本申请的一个实施例中,信用评估模型是预先训练的机器学习模型,信用评估结果可以是违约概率等。将社交属性特征输入该信用评估模型,可以由该信用评估模型对申请者的社交属性特征进行分析,输出申请者的信用评估结果。
在本申请的一个实施例中,还包括:获取申请者的样本训练集,所述样本训练集中的每个训练样本包含有申请者的社交属性特征及针对该申请者标定的信用评估结果;将所述样本训练集中的训练样本输入该信用评估模型中对该信用评估模型进行训练,以使该风险指数计算模型输出的各个训练样本的信用评估结果与各个训练样本包含的信用评估结果之间的误差小于预定要求。
在本申请的一个实施例中,得到对申请者的信用评估结果包括:将社交属性特征连同申请者的历史还款记录一起应用于信用评估模型,以得到信用评估结果。
申请者的历史还款记录可以反映申请者的信用类型,可以由历史还款记录由专家标定申请者的违约概率或者信用类型等信用评估结果。进而,可以将申请者的社交属性特征作为信用评估模型的输入数据,将标定的信用评估结果作为期望输出,训练风险评估模型。
在本申请的一个实施例中,得到对申请者的信用评估结果包括:将申请者的n维社交属性特征(X1,X2,…,Xn)应用于逻辑回归LR信用评估模型,以为每一维特征Xk生成相应的权重系数Ak,并根据下式计算申请者的违约概率P:
P=Sigmoid(A1*X1+A2*X2+…+An*Xn)。
逻辑回归LR信用评估模型是预先训练的LR回归模型,可以对输入的n维社交属性特征(X1,X2,…,Xn)进行线性拟合,得到每一维特征Xk生成相应的权重系数Ak,进而得到线性函数的结果:A1*X1+A2*X2+…+An*Xn。最后利用Sigmoid函数,将线性函数的结果转化到0和1之间,得到申请者的违约概率P。其中,P取值越大则代表用户的违约概率越大,则其今后违约的可能性就越高。
逻辑回归LR信用评估模型的训练方法可以包括:获取申请者的样本训练集,所述样本训练集中的每个训练样本包含有申请者的社交属性特征及针对该申请者标定的信用评估结果;将所述样本训练集中的训练样本输入该逻辑回归LR信用评估模型中对该逻辑回归LR信用评估模型进行训练,以使该逻辑回归LR信用评估模型输出的各个训练样本的信用评估结果与各个训练样本包含的信用评估结果之间的误差小于预定要求。
例如,对于逻辑回归LR信用评估模型输入训练样本的社交属性特征:11,23,…,44;该样本标定的信用评估结果为:0.9。逻辑回归LR信用评估模型的拟合函数h(θ)=θ1X1+θ2X2+...+θnXn,其中,X1、X2、...、Xn为社交属性特征数据,则X1、X2、...、Xn依次等于11,23,…,44,对于该样本通过训练参数θ1、θ2、...、θn,使得得到h(θ)的值与0.9的差值小于预定阈值。其中参数θ1、θ2、...、θn通过梯度下降法用逻辑回归LR信用评估模型的目标函数对θ求导,按照偏导数的反方向进行更新,直到收敛,当网络训练误差达到规定的程度,训练结束。
以这种方式,逻辑回归LR信用评估模型可以准确地根据社交属性特征,对申请者进行信用评估。
在本申请的一个实施例中,得到对申请者的信用评估结果还包括:根据下式将违约概率P转换成所述申请者的信用分数S:
S1=650+50*((ln((1-P)/P)-ln(50))/ln(2)),
S=MIN(MAX(S1,300),850)。
这样可以将p转化为信用分数,违约概率P越小,则信用分S越大,其取值为[300,850],可以通过信用分数和传统金融机构对接。
在本申请的一个实施例中,在将该社交属性特征应用于信用评估模型,以得到对该申请者的信用评估结果之后,还可以包括:
如果该信用评估结果属于评估通过,根据该申请者的申请业务相关信息完成业务操作;
将完成该申请业务的操作记录数据加密共享至业务区块链的相关节点,以使得相关节点验证该记录数据后存入区块。
信用评估结果属于评估通过可以是违约概率低于预定阈值或者信用评分高于预定阈值等;业务区块链可以是与申请者的业务相关的多个机构的服务器等终端组成的区块链网络。当申请者的信用评估结果属于评估通过,根据该申请者的申请业务相关信息(例如,用户贷款申请相关信息)完成业务操作(例如,完成贷款审批业务操作),得到对应的记录数据(例如,审批金额等);进而可以在完成业务操作的服务器等设备连接在业务区块链网络(例如,多个银行网点服务器组成的业务区块链)时,通过将完成该申请业务的操作记录数据加密共享至业务区块链的相关节点(例如,多个具有联合关系的银行网点服务器等),以使得相关节点验证该记录数据有效后,作为承认账目数据有效的响应,将记录数据存入临时区块中。
总之,本申请的实施例可以通过构建申请者的社交关系网络,利用Node2Vec方法将申请者的社交信息纳入到信用评分模型中,可以挖掘到申请者与好友的信用意识和观念之间的相互影响的潜在信用特征,进行准确地信用评估;且社交属性特征不需要人工去衍生提取,直接由Node2Vec自动衍生出用户的社交属性特征,相较于传统的信用模型开发过程则需要依靠经验手动衍生变量,减少了模型开发人员模型开发的工作量。进而,有效提升了申请者信用评估的效率和准确性。
本申请的实施例可运用到银行、小额贷款公司、消费金融公司等金融机构的贷款审批和信用卡审批过程中,进行申请者信用评估,能够降低信用等级低的用户通过率,减少贷款核信用卡坏账不良率,改善授信金融机构的贷后资产表现。
图5示意性示出了根据本申请的一个实施例的信用评估装置的框图。
如图5所示,信用评估装置400可以包括构建模块410、提取模块420及评估模块430。
构建模块410可以用于基于申请者的社交数据,构建所述申请者的社交关系网络;提取模块420可以用于利用Node2Vec算法,从所述社交关系网络提取所述申请者的社交属性特征;评估模块430可以用于将所述社交属性特征应用于信用评估模型,以得到对所述申请者的信用评估结果。
在本申请的一些实施例中,所述提取模块还被配置成:将所述社交关系网络代入Node2Vec算法,以得到所述申请者的n维社交属性特征(X1,X2,…,Xn),其中每一维特征Xk表示所述申请者的特定社交属性,n为大于2的整数,且k=1,2,…,n。
在本申请的一些实施例中,所述评估模块还被配置成:将所述n维社交属性特征(X1,X2,…,Xn)应用于逻辑回归LR信用评估模型,以为每一维特征Xk生成相应的权重系数Ak,并根据下式计算所述申请者的违约概率P:P=Sigmoid(A1*X1+A2*X2+…+An*Xn)。
在本申请的一些实施例中,所述评估模块还被配置成:根据下式将所述违约概率P转换成所述申请者的信用分数S:
S1=650+50*((ln((1-P)/P)-ln(50))/ln(2)),
S=MIN(MAX(S1,300),850)。
在本申请的一些实施例中,还包括爬取模块被配置成:在构建所述申请者的社交关系网络之前,从社交网络服务器获取所述申请者的好友数据以及所述申请者及其各个好友相互之间的联络数据作为所述社交数据。
在本申请的一些实施例中,所述构建模块还被配置成:将所述申请者及其各个好友分别表示为所述社交关系网络的多个节点;基于所述联络数据,形成所述多个节点中相应节点之间的连接边。
在本申请的一些实施例中,所述构建模块还被配置成:根据所述相应节点之间的转账金额或通信次数中的至少一种,形成所述连接边。
在本申请的一些实施例中,所述评估模块还被配置成:将所述社交属性特征连同所述申请者的历史还款记录一起应用于所述信用评估模型,以得到所述信用评估结果。
在本申请的一些实施例中,还包括业务操作模块被配置成:如果所述信用评估结果属于评估通过,根据所述申请者的申请业务相关信息完成业务操作;将完成所述申请业务的操作记录数据加密共享至业务区块链的相关节点,以使得相关节点验证该记录数据后存入区块。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
图6示意性示出了根据本申请的一个实施例的电子设备的框图。
需要说明的是,图6示出的电子设备500仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,电子设备500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机存取存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统操作所需的各种程序和数据。CPU501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN(局域网)卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本申请的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光纤、便携式光盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的实施例,而可以在不脱离其范围的情况下进行各种修改和改变。
Claims (10)
1.一种信用评估方法,其特征在于,包括:
基于申请者的社交数据,构建所述申请者的社交关系网络;
利用Node2Vec算法,从所述社交关系网络提取所述申请者的社交属性特征;
将所述社交属性特征应用于信用评估模型,以得到对所述申请者的信用评估结果。
2.根据权利要求1所述的方法,其特征在于,所述提取所述申请者的社交属性特征包括:将所述社交关系网络代入Node2Vec算法,以得到所述申请者的n维社交属性特征(X1,X2,…,Xn),其中每一维特征Xk表示所述申请者的特定社交属性,n为大于2的整数,且k=1,2,…,n。
3.根据权利要求2所述的方法,其特征在于,所述得到对所述申请者的信用评估结果包括:
将所述n维社交属性特征(X1,X2,…,Xn)应用于逻辑回归LR信用评估模型,以为每一维特征Xk生成相应的权重系数Ak,并根据下式计算所述申请者的违约概率P:
P=Sigmoid(A1*X1+A2*X2+…+An*Xn)。
4.根据权利要求3所述的方法,其特征在于,所述得到对所述申请者的信用评估结果还包括:
根据下式将所述违约概率P转换成所述申请者的信用分数S:
S1=650+50*((ln((1-P)/P)-ln(50))/ln(2)),
S=MIN(MAX(S1,300),850)。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:在构建所述申请者的社交关系网络之前,从社交网络服务器获取所述申请者的好友数据以及所述申请者及其各个好友相互之间的联络数据作为所述社交数据。
6.根据权利要求5所述的方法,其特征在于,所述构建所述申请者的社交关系网络包括:
将所述申请者及其各个好友分别表示为所述社交关系网络的多个节点;
基于所述联络数据,形成所述多个节点中相应节点之间的连接边。
7.根据权利要求6所述的方法,其特征在于,所述形成所述多个节点中相应节点之间的连接边包括:根据所述相应节点之间的转账金额或通信次数中的至少一种,形成所述连接边。
8.根据权利要求1所述的方法,其特征在于,在将所述社交属性特征应用于信用评估模型,以得到对所述申请者的信用评估结果之后,
如果所述信用评估结果属于评估通过,根据所述申请者的申请业务相关信息完成业务操作;
将完成所述申请业务的操作记录数据加密共享至业务区块链的相关节点,以使得相关节点验证该记录数据后存入区块。
9.一种信用评估装置,其特征在于,包括:
构建模块,用于基于申请者的社交数据,构建所述申请者的社交关系网络;
提取模块,用于利用Node2Vec算法,从所述社交关系网络提取所述申请者的社交属性特征;
评估模块,用于将所述社交属性特征应用于信用评估模型,以得到对所述申请者的信用评估结果。
10.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器中存储有指令程序,所述指令程序在由所述处理器执行时实现根据权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910849709.1A CN110599329A (zh) | 2019-09-09 | 2019-09-09 | 信用评估方法、信用评估装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910849709.1A CN110599329A (zh) | 2019-09-09 | 2019-09-09 | 信用评估方法、信用评估装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110599329A true CN110599329A (zh) | 2019-12-20 |
Family
ID=68858329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910849709.1A Pending CN110599329A (zh) | 2019-09-09 | 2019-09-09 | 信用评估方法、信用评估装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110599329A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701704A (zh) * | 2015-12-31 | 2016-06-22 | 先花信息技术(北京)有限公司 | 用户可信度社交网络数据的处理方法 |
CN107194795A (zh) * | 2016-03-15 | 2017-09-22 | 腾讯科技(深圳)有限公司 | 信用分数模型训练方法、信用分数计算方法及装置 |
CN108399509A (zh) * | 2018-04-12 | 2018-08-14 | 阿里巴巴集团控股有限公司 | 确定业务请求事件的风险概率的方法及装置 |
CN109087163A (zh) * | 2018-07-06 | 2018-12-25 | 阿里巴巴集团控股有限公司 | 信用评估的方法及装置 |
-
2019
- 2019-09-09 CN CN201910849709.1A patent/CN110599329A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701704A (zh) * | 2015-12-31 | 2016-06-22 | 先花信息技术(北京)有限公司 | 用户可信度社交网络数据的处理方法 |
CN107194795A (zh) * | 2016-03-15 | 2017-09-22 | 腾讯科技(深圳)有限公司 | 信用分数模型训练方法、信用分数计算方法及装置 |
CN108399509A (zh) * | 2018-04-12 | 2018-08-14 | 阿里巴巴集团控股有限公司 | 确定业务请求事件的风险概率的方法及装置 |
CN109087163A (zh) * | 2018-07-06 | 2018-12-25 | 阿里巴巴集团控股有限公司 | 信用评估的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11170395B2 (en) | Digital banking platform and architecture | |
Romano et al. | Beyond bitcoin: A critical look at blockchain-based systems | |
US20190104197A1 (en) | Discovering signature of electronic social networks | |
EP4236197A2 (en) | Micro-loan system | |
CN112465627B (zh) | 基于区块链和机器学习的金融借贷审核方法及系统 | |
WO2018142260A1 (en) | Computer-implemented system and method for generating and extracting user related data stored on a blockchain | |
CN105590055A (zh) | 用于在网络交互系统中识别用户可信行为的方法及装置 | |
CN113011895B (zh) | 关联账户样本筛选方法、装置和设备及计算机存储介质 | |
CN112039702B (zh) | 基于联邦学习和相互学习的模型参数训练方法及装置 | |
CN113609345B (zh) | 目标对象关联方法和装置、计算设备以及存储介质 | |
Vahdati et al. | A self-organized framework for insurance based on internet of things and blockchain | |
CN112749827A (zh) | 金融信息处理方法、装置、电子设备及存储介质 | |
CN115063233A (zh) | 一种银行业务服务流程的实现方法、系统及装置 | |
KR101972554B1 (ko) | 에이전시 매칭방법, 장치 및 프로그램 | |
Ali et al. | Incentive-driven federated learning and associated security challenges: A systematic review | |
CN111951050B (zh) | 理财产品推荐方法及装置 | |
CN115631008B (zh) | 商品推荐方法、装置、设备及介质 | |
CN110599329A (zh) | 信用评估方法、信用评估装置及电子设备 | |
US20210279824A1 (en) | Property Valuation Model and Visualization | |
Kingsly | Disruptive Technology: Blockchain: The Crystal Ball: Advancing Financial Trust, Inclusion, and Simplicity Through the Blockchain | |
US11561963B1 (en) | Method and system for using time-location transaction signatures to enrich user profiles | |
CN111079992A (zh) | 数据处理方法、装置和存储介质 | |
CN111178535A (zh) | 实现自动机器学习的方法和装置 | |
Ural et al. | Survey on Blockchain-Enhanced Machine Learning | |
US20240112072A1 (en) | Generating counterfactual samples based on user preference |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |