New! Search for patents from more than 100 countries including Australia, Brazil, Sweden and more

CN105931116A - 基于深度学习机制的自动化信用评分系统及方法 - Google Patents

基于深度学习机制的自动化信用评分系统及方法 Download PDF

Info

Publication number
CN105931116A
CN105931116A CN201610249083.7A CN201610249083A CN105931116A CN 105931116 A CN105931116 A CN 105931116A CN 201610249083 A CN201610249083 A CN 201610249083A CN 105931116 A CN105931116 A CN 105931116A
Authority
CN
CHINA
Prior art keywords
data
credit
type
user
mechanism
Prior art date
Application number
CN201610249083.7A
Other languages
English (en)
Inventor
徐潇然
尹俊岭
赵磊
冯嘉慧
韩晓楠
吕倩
Original Assignee
帮帮智信(北京)教育投资有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 帮帮智信(北京)教育投资有限公司 filed Critical 帮帮智信(北京)教育投资有限公司
Priority to CN201610249083.7A priority Critical patent/CN105931116A/zh
Publication of CN105931116A publication Critical patent/CN105931116A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computer systems based on biological models
    • G06N3/02Computer systems based on biological models using neural network models
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06QDATA PROCESSING SYSTEMS OR METHODS, SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL, SUPERVISORY OR FORECASTING PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL, SUPERVISORY OR FORECASTING PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce, e.g. shopping or e-commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping
    • G06Q30/0609Buyer or seller confidence or verification
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06QDATA PROCESSING SYSTEMS OR METHODS, SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL, SUPERVISORY OR FORECASTING PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL, SUPERVISORY OR FORECASTING PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation, credit approval, mortgages, home banking or on-line banking

Abstract

本发明公开了一种基于深度学习机制的自动化信用评分系统,包括:A.底层机构,用于负责用户特征维度数据的构建;B.左脑机构,用于筛选底层机构中与信用较为相关的特征维度,依托规则库打分策略得到用户的初步信用分;C.右脑机构,用于搭建多层神经网络,通过无监督学习下的下层网络和有监督学习下的上层网络,完成基于深度学习机制的用户信用评分。还公开了基于深度学习机制的自动化信用评分方法。本发明采用“双脑”架构进行机器学习,在学习过程中,左脑指导右脑,为右脑提供大量训练数据,右脑弥补左脑,提供左脑欠缺的自我学习和自我适应能力,则左右脑相互协作,更为精确的得出用户的信用分数,为金融信贷行业提供了强有力的支持。

Description

基于深度学习机制的自动化信用评分系统及方法

技术领域

[0001]本发明涉及信用评分技术领域,特别是涉及一种基于深度学习机制的自动化信用评分系统及方法。

背景技术

[0002]信用评分技术是一种基于计算机模型的量化贷款申请人信用或违约可能性的信用风险分析方法。随着互联网和移动互联网的发展,以及海量数据积累和大数据技术的成熟,国内外一些公司正试图将大数据应用于信用评分领域。如ZestFinance公司旨在将机器学习和大数据挖掘算法带入征信领域,开发了多个基于机器学习的分析模型,得出上万个针对用户行为的测量指标,可以在几秒内对贷款申请人做出评分。还有闪银是2013年成立的国内一家新兴互联网金融企业,主要利用数据分析技术和机器学习算法,根据用户在社交媒体等公开平台上发布的信息,评估得出用户的信用额度及偿还能力。这一过程通常仅需几分钟。闪银关注的多为有偿还能力但没有太多信用历史记录的人群,基于申请人绑定的社交平台账号,通过聚合形成对个人背景信息、社交活跃度、社交密度、社会影响力的评判,分析出个人在互联网上的行为轨迹和历史信息,从而做出信用评分。总的来说,传统信用评分模型基于少量的强相关信息,如收入流水、违约记录等,大数据信用评分模型考虑的是海量的弱相关信息,如用户的社交行为、浏览行为、地理位置变化等,依托机器学习中的相关技术,不断修正模型参数。

[0003]机器学习是近十年兴起的数据自动化分析技术,包含的模型种类繁多,应用何种模型在互联网信贷业务中尚无统一标准。近几年,一项新技术引发众多兴趣,就是深度学习技术,它被广泛应用在图像识别、自然语言处理和机器翻译中。如基于深度学习的围棋对弈机器AlphaGo成功战胜人类围棋冠军,展现出超强的学习能力,进而引发人们广泛联想,能否将此方法应用在更广泛的领域,如本发明所讲的信用评分领域。

[0004]目前自动化信用评分技术有多种实现途径,如基于规则库的打分策略、基于常用机器学习模型的有监督学习方法,如:逻辑回归、决策树以及随机森林。前者类似专家系统,需要专业人员结合领域知识预先设计规则库,模型的有效性完全取决于规则库是否充分详尽,往往需要的人力成本很大;后者采用有监督学习的方法,需要有大量的训练数据。经典的有监督学习方法,在一定程度上可以满足信用评分的要求,当输入给模型的特征向量存在强相关的维度或维度组合,模型的结果会很好,但是当使用的特征维度质量不高时,模型自身的局限性就会显露出来。

[0005]深度学习的能力已经被人们广泛领略过,但是要想让深度学习方法充分发挥作用,还有几个面临的问题需要解决:

[0006] (I)如何构造大量的训练集?深度学习方法只有在大量训练数据的基础上才能展现出优秀的学习能力,图像数据和文本数据不难做到这点,但是对于业务数据,尤其是在评价个人信用上,用户数量是有限的,在用户上可获取的有效信息更加有限,深度学习在信用评分领域面临数据缺乏的严重问题。

[0007] (2)如何训练深度学习模型?很多机器学习的模型,尤其是有监督学习模型,预测效果的好坏取决于训练集的数量和质量。当训练集中标注的目标值不是很准确时,学习的模型就会大打折扣。在实际征信中,我们很难人工地对用户的信用分数给出一个准确值,即使我们已经获悉了用户的大量信息。

[0008]由此可见,为解决现有模型学习能力不足和深度学习在信用评分领域面临数据缺乏的严重问题,本发明创设了一种基于深度学习机制的自动化信用评分系统及方法。

发明内容

[0009]本发明要解决的技术问题是提供一种基于深度学习机制的自动化信用评分系统,使其能更为精确的得出用户的信用分数,从而克服现有的信用评分系统的不足。

[0010]为解决上述技术问题,本发明提供一种基于深度学习机制的自动化信用评分系统,包括:

[0011 ] A.底层机构,用于负责用户特征维度数据的构建;

[0012] B.左脑机构,用于筛选所述底层机构中用户特征维度数据与信用较为相关的特征维度,依托预先建立的规则库采用打分策略得到用户的初步信用分;

[0013] C.右脑机构,用于搭建多层神经网络,通过无监督学习下的下层网络和有监督学习下的上层网络,完成基于深度学习机制的用户信用评分;

[0014]所述无监督学习下的下层网络是根据所述底层机构中用户特征维度数据搭建的;所述有监督学习下的上层网络是基于所述下层网络并根据所述左脑机构中得到的用户初步信用分搭建的。

[0015]作为本发明的一种改进,所述底层机构包括:

[0016]原始特征采集模块,用于汇总用户的原始特征数据,构造多个原始维度的R型数据,所述R型数据为与用户个人相关的原始信息;

[0017]用户特征拓展模块,用于根据所述R型数据的具体信息维度拓展其背后的含义,形成E型数据;

[0018]特征标准化模块,用于将所述E型数据转换为可作为评分模型输入的向量化数据,形成X型数据。

[0019]进一步改进,所述用户个人相关的原始信息包括用户提交的个人基本资料、工作信息、教育信息、家庭信息、财产信息,以及用户授权的来自第三方的用户社交信息、消费信息和用户使用APP的日志信息、从Web抓取的用户相关信息。

[0020]进一步改进,所述左脑机构包括:

[0021]规则库,为预先设定好的具有不同规则的模块,所述规则库中的每项规则为用户的一个特征维度或多个相关维度的组合;

[0022]特征精选模块,用于从所述底层机构的用户特征维度数据中精选出与信用相关的特征维度数据;

[0023]规则匹配模块,用于根据所述特征精选模块精选的用户特征维度完成对所述规则库中每项规则的匹配;

[0024]规则打分模块,用于把匹配到所述规则库中的每项特征维度数据转换成具体的分数;

[0025]总分校对模块,用于采用加和的方式汇总所述规则打分模块得出的每项特征维度数据相应的分数,最终得出用户的初步信用分。

[0026]进一步改进,所述自动化信用评分系统还包括:

[0027]用户原始数据存储模块,用于存储和管理由所述底层机构采集的R型数据、E型数据和X型数据;

[0028] X ’型数据生成和存储模块,用于对X ’型数据进行生成和存储;所述X ’型数据是在所述E型数据的基础上做局部微调,改动某个特征维度上的值,得到与原用户的信用情况相当的模拟用户数据;

[0029] X”型数据生成和存储模块,用于对X”型数据进行生成和存储;所述X”型数据是在X型数据的基础上随机挑选几个特征维度,通过改动、删除或增加几个特征维度,以扩充X型数据而得的模拟用户数据。

[0030]进一步改进,所述自动化信用评分系统还包括:

[0031] Y型数据采集存储模块,用于采集和存储根据其他征信平台的信用记录、特殊的用户标签或用户的实际违约情况,经人工审核得出的Y型数据;

[0032] Y’型数据存储模块,用于存储由所述左脑机构得出的Y’型数据;所述Y’型数据为所述左脑机构根据所述底层机构得出的X型数据,采用所述规则库的打分策略评估出的用户初步信用分;

[0033]进一步改进,所述Y’型数据为在所述X型数据、X’型数据或X”型数据中筛选与信用较为相关的相同维度的特征数据输入所述左脑机构,采用所述规则库打分策略评估出的用户初步信用分。

[0034]进一步改进,所述自动化信用评分系统还包括:

[0035] Z型数据补充模块:用于存储并管理Z型数据,且为所述右脑机构进行深度学习得出的用户信用分提供补充和校正作用;所述Z型数据是经人工评估得出的两个用户信用分大小关系或同一用户Y型数据与Y’型数据得到的比较对。

[0036]本发明还提供一种基于深度学习机制的自动化信用评分方法,所述方法包括如下步骤:

[0037] (I)用户特征数据的准备:通过汇总与用户个人相关的原始信息数据,构造R型数据;并通过对R型数据的具体信息维度进行拓展,得到E型数据;再通过标准化特征E型数据,形成特征向量化X型数据;

[0038] (2)基于规则库的打分策略,为用户提供初步信用分:从上述步骤(I)中得到的用户特征数据中筛选与信用相关的用户特征维度数据;依托预先设定的规则库并采用打分策略得出用户的初步信用分,即Y’型数据;

[0039] (3)通过深度学习机制得出用户的最终信用分:基于上述步骤(I)中得到的用户特征数据进行无监督的学习,搭建无监督学习的下层网络;在所述下层网络的基础上,结合所述步骤(2)中得到的评分结果搭建有监督学习的上层网络,通过深度学习方法计算用户的最终信用分,即Y”型数据。

[0040]作为本发明的一种改进,所述步骤(I)中还包括X’型数据和X”型数据的生成步骤;所述X’型数据是在所述E型数据的基础上做局部微调,改动某个特征维度上的值,而得到的与原用户信用情况相当的模拟用户数据;所述X”型数据是在所述X型数据的基础上随机挑选几个特征维度,通过改动、删除或增加几个特征维度,以扩充X型数据而得到的模拟用户数据;

[0041]所述步骤(2)中与信用相关的用户特征维度数据是从所述X型数据、X’型数据或X”型数据中筛选的与信用相关的相同维度的特征数据;

[0042]所述步骤(3)中还包括利用人工评估得出的信用分比较对对所述有监督学习的上层网络进行调参优化的步骤。

[0043]采用上述的技术方案,本发明至少具有以下优点:

[0044]本发明采用“双脑”架构进行机器学习,其中“左脑”基于人工设计的规则库给出用户初步的信用评分,“右脑”采用多层神经网络的深度学习机构给出评分。在学习的过程中,左脑指导右脑,为右脑提供大量可作参考的训练数据,右脑弥补左脑,提供左脑欠缺的自我学习和自我适应能力。则左右脑在学习过程中相互协作,通过规则库方案有效解决深度学习方法在信用评分领域面临的数据匮乏问题。本发明将深度学习机制引入到信用评分领域,借助人工智能的大幅进步,将信用评分技术推进到一个全新的境地,大大提升金融信贷业务领域的工作效率和服务质量。

附图说明

[0045]上述仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下结合附图与具体实施方式对本发明作进一步的详细说明。

[0046]图1是本发明基于深度学习机制的自动化信用评分系统的结构示意图。

具体实施方式

[0047]基于前所背景技术,本发明要建立基于深度学习方法的信用评分框架,并制定从有限数据不断扩充训练集的策略和制定训练深度学习模型的基本步骤,具体方法和系统如下:

[0048]本发明基于深度学习机制的自动化信用评分系统主要包括如下模块:

[0049] 1.底层机构,用于负责特征工程中用户特征维度数据的构建。其包括:

[0050] 1.1原始特征采集模块:该模块汇总多个源的用户原始特征数据,构造R型数据。R型(Raw Type)数据:系统收集到的与用户个人相关的原始信息,包括用户提交的个人基本资料、工作信息、教育信息、家庭信息、财产信息等,以及用户授权的来自第三方的用户社交信息、消费信息等,还包括用户使用APP的日志信息、从Web抓取的用户相关信息以及人工录入的用户数据等。这些来自不同源的数据以JSON格式保存,每一个key对应一个原始维度,例如:“手机号:134 X X X X 5369”、“身份证号”、“手机类型:小米4”等等。

[0051] 1.2用户特征拓展模块:该模块根据R型数据的具体信息维度,查询事先备好的各类基础知识库(如:中国区域统计数据库,手机号归属地,手机型号价格表等),拓展R型数据为E型数据。E型(Enriched Type)数据:系统依据R型数据的原始维度信息拓展其背后的含义,如根据手机号可以得到两个维度:运营商和手机号归属地,根据身份证号可以得到三个维度:生日、性别和初始户籍地,根据手机类型我们可以得到手机价格这一维度。这样的维度拓展过程可以递归地进行下去,如根据户籍地(县级行政区划)得到个人成长地域的经济发展指标、文化教育程度等,根据生日得到用户所处年龄段和星座等。最后,我们得到一个丰富的特征维度集,例如:“运营商:中国移动”、“手机号地:北京市”、“年龄:30”、“星座:天秤座”、“性别:男”、“户籍地:河北省邯郸市磁县”、“户籍地2010年人均GDP:18710.51元”、“户籍地2010年文盲率:9.92%”、“手机价格:1700元”等等。

[0052] 1.3特征标准化模块:该模块将E型数据转换为可供模型输入的布尔型向量X型数据。X型数据:系统把描述一个实际用户的E型数据转换成一个可作为评分模型输入的向量化数据,且每个维度是布尔变量,如V= (V1J2,V3,…),其中¥工表示用户是否为25岁以下,V2表示用户是否为男性,V3表示用户的户籍地是否为一线城市等。这样做的目的是统一数据格式,无论原始维度是何种格式的信息,最后都被转化为一串0/1格式的信息,便于应用到多个不同的数学模型中。如果原始维度对应一个标量值,就将该值根据事先定义的标准或样本整体分布离散化成几段,那么原始的一个维度会被拆成几个维度。

[0053] 2.左脑机构,用于筛选与信用较为相关的特征,依托预先建立的规则库采用打分策略得到用户的初步信用分,得到Y,型数据。其包括:

[0054] 2.1规则库为预先设定好每项规则的模块,该规则库中的每项规则可仅指用户的一个特征维度,也可涉及多个相关维度的组合。

[0055] 2.2特征精选模块:该模块精选出可被人工辨识的与信用相关的特征维度,以供规则匹配使用。这些与信用相关的特征有:填写资料的完整度和合规度、户籍地所在地域的社会经济发展情况、用户本人的学历信息和毕业院校、用户工作所在单位、用户授权通讯录信息的真实性、用户在申请中是否完成多项拍照认证等等。

[0056] 2.3规则匹配模块:该模块根据精选的用户特征维度,完成对规则库中每项规则的匹配。

[0057] 2.4规则打分模块:该模块把匹配到的一条条规则转换成一项项分数。除此之外,该规则打分模块还负责统计规则的分数分布和人数分布,并对每项分数进行相应的调整。

[0058] 2.5总分校对模块:此模块采用加和的方式汇总每一项所得或所扣分数,当总分逼近阈值时,总分的成长速度会变慢,当总分超出阈值时,总分超出的部分会截掉。

[0059] 3.右脑机构,用于搭建多层神经网络,对底层的弱相关特征信息进行层层抽象和加工,采用非监督学习方法,对加工后的高层特征用作训练集进行有监督学习。采用无监督和有监督的学习策略,构建无需规则库的适应性强的信用评分系统,最终得出用户的信用分Y”型数据。

[0060] 其包括:

[0061] 3.1无监督学习下的下层网络:神经网络的输入无需是经筛选的用户特征,原则上所有用户数据都应当作为输入值。无监督学习阶段,不需要考虑用户的信用分数,而是通过一层一层搭建Belief Network或用其他现有的每层学习模型构造出多层的神经网络架构,形成下层神经网络。这样,用户最初的特征维度会被层层抽象和重组,浮现出有意义的复合特征。

[0062] 3.2有监督学习下的上层网络:基于下层网络优化出的新特征和左脑机构得出的Y’型数据,采用任何现有的有监督学习模型去计算最终的信用分,得出Y”型数据,比如:多层感知机、SVM等。

[0063]本发明还包括一些辅助模块,用于训练数据的生成和存储。该辅助模块包括有:

[0064] 4.用户原始数据存储模块:用于存储和管理由底层机构采集的R型数据、对R型数据维度拓宽得到E型数据和对E型数据标准化得到布尔型特征向量X型数据;

[0065] 5.X’型数据生成和存储模块:用于对X’型数据进行生成和存储。

[0066] X’型数据:是对X型数据的前身一一E型数据做局部微调,改动某个特征维度上的值,使得到的模拟用户数据与原用户的信用情况相当,如针对学校这个维度,北京大学与清华大学可以互相替换,北京科技大学与北京交通大学可以相互替换。所以X’型数据描述的不是一个实际用户,而是一个模拟用户,为了增加数据样本而得到。

[0067] 6.X”型数据生成和存储模块:用于对X”型数据进行生成和存储。

[0068] X”型数据:与X’型数据不同的是,新得到的模拟用户数据不必与原用户的信用情况相当,而且我们可以采用更灵活的抽样方法,随机挑选几个特征维度,或改动,或删除,也可以随机增加几个特征维度。这样做的目的是快速扩充X型数据。当然也可以采用其他构造模拟用户的方法。

[0069] 7.Y型数据采集存储模块:Y型数据为经人工审核得出的信用分。在真实情况下用户的信用分(O〜1600)理论上是不可知的,实际上针对老用户,我们通过老用户的历史信用记录如按时还款情况和有无违约情况间接给出Y值。但是,对于新注册用户而言,由于系统缺乏足够的历史信用记录,他们的Y型数据是很难准确给出的。有一小部分用户可以根据其他征信平台(如芝麻信用、央行个人征信报告)的信用分数或信用记录得到一个参考的Y值。或者对于拥有某些特殊标签的用户群体(如大型合作企业推荐的职工生源),我们可以仅根据某几个维度快速地人工评估出一个Y值。

[0070]该Y型数据采集存储模块就是用于采集和存储根据其他征信平台的信用记录、特殊的用户标签或用户的实际违约情况,经人工审核得出的Y型数据。

[0071] 8.Y’型数据存储模块:用于存储由左脑机构得出的Y’型数据。

[0072]该Y’型数据为左脑机构根据底层机构得出的X型数据,采用规则库的打分策略评估出的用户信用分数。

[0073]较优实施例为在上述X型数据、X’型数据或X”型数据中筛选与信用较为相关的相同维度的特征数据输入左脑机构,采用规则库打分策略打出用户的信用分,得到Y’型数据。

[0074] 9.Z型数据补充模块:用于存储并管理Z型数据。

[0075] Z型数据:由于依靠人工评估的方法构造Y型数据是一件非常难的事,但是比较两个用户的个人信息并说出谁的信用更好一点,在某些用户对的比较上相对还是容易的,在此基础上构建了 Z型数据,Z型数据指的是经人工评估得出的两个用户的信用分大小关系、或同一用户Y型数据与Y’型数据得到的比较对,以及当Y值与Y’值产生矛盾时经人工比较审定的大小关系。

[0076]该Z型数据为右脑机构最终得出更为准确的用户信用分提供补充和校正作用。

[0077]根据上述基于深度学习机制的自动化信用评分系统的评分方法具体流程为:

[0078] (I)用户特征数据的准备

[0079 ] a)原始数据采集、清洗和整理;

[0080]通过上述原始特征采集模块汇总多个源的用户特征数据,构造R型数据。

[0081] b)基于基础知识库对用户原始数据进行拓展;

[0082]通过用户特征拓展模块根据R型数据的具体信息维度,查询事先备好的各类基础知识库,拓展R型数据为E型数据。

[0083] c)标准化用户数据形成特征向量;

[0084]通过特征标准化模块将E型数据转换为可供模型输入的布尔型向量X型数据。

[0085] d)X’型数据和X”型数据生成;

[0086]通过X ’型数据生成和存储模块生成X ’型数据;

[0087]通过X”型数据生成和存储模块生成X”型数据。

[0088] (2)基于规则库的打分策略,为用户提供初步的信用分。

[0089] a)筛选与信用相关的用户特征维度;

[0090]可基于步骤(I)中得出的特征向量数据X型数据、X’型数据和X”型数据,通过该特征精选模块在上述X型数据、X’型数据或X”型数据中筛选与信用较为相关的相同维度的特征数据。

[0091] b)基于规则库的规则匹配和打分;

[0092]依托规则库并采用规则匹配模块和规则打分模块打出用户的信用分。

[0093] c)计算总分并进行校正;

[0094]通过总分校正模块得到该用户的信用分Y’数据。

[0095]采用规则库的打分策略完成的这个信用分可能不够准确,但是为右脑机构提供了大量有标注的训练数据,大大拓展了原始训练集。

[0096] (3)通过深度学习机制得出用户的最终信用分Y”数据

[0097] a)基于用户特征向量的无监督学习,搭建下层的多层神经网络;

[0098]根据上述步骤(I)得到的特征向量数据X型数据、X’型数据和X”型数据,无需筛选的全都输入右脑机构,用于一层一层的搭建Belief Network学习模型,构造出多层的神经网络架构,形成无监督学习下的下层神经网络。

[0099] b)根据左脑评分结果和下层网络进行有监督学习,完成上层神经网络;

[0100]通过步骤(2)得到的Y’数据和基于下层网络优化出的新特征,搭建有监督学习下的上层网络,采用现有的有监督学习模型去计算最终的信用分,得Y”数据。

[0101] c)对顶层神经网络进行调参优化;

[0102]根据Z型数据补充模块提供的Z型数据,对上层网络进行调参优化,最终由右脑机构更加准确的得出用户的最终信用分Y”数据。

[0103]总的说来,采用规则库打分的方法,最大的好处是无需标注好的训练集,而这点恰恰满足了深度学习方法严重依赖大量训练集的需求;反过来,虽然规则库方法是给定的,其适应性较差,基本没有什么学习能力,但是依靠它制造的大量训练集而学习出来的多层神经网络,则有超强的自适应性和学习能力。本发明就是将上述两种方法结合,得出的一种基于深度学习机制的自动化信用评分系统和方法。该自动化信用评分方法对左右脑评分进行加权平均,初期主要依赖左脑机构的评分,中后期渐渐依赖右脑机构的评分。

[0104]本发明创新地提出了 “双脑”架构,通过传统基于规则库的打分方法,来指导深度学习网的学习过程,有效地解决深度学习中严重依赖大量训练集的问题。此外,“双脑”的并驾齐驱,解决了数据积累过程中,前期和中后期的模型有效性的过渡问题。

[0105]以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,本领域技术人员利用上述揭示的技术内容做出些许简单修改、等同变化或修饰,均落在本发明的保护范围内。

Claims (10)

1.一种基于深度学习机制的自动化信用评分系统,其特征在于,包括: A.底层机构,用于负责用户特征维度数据的构建; B.左脑机构,用于筛选所述底层机构中用户特征维度数据与信用较为相关的特征维度,依托预先建立的规则库采用打分策略得到用户的初步信用分; C.右脑机构,用于搭建多层神经网络,通过无监督学习下的下层网络和有监督学习下的上层网络,完成基于深度学习机制的用户信用评分; 所述无监督学习下的下层网络是根据所述底层机构中用户特征维度数据搭建的;所述有监督学习下的上层网络是基于所述下层网络并根据所述左脑机构中得到的用户初步信用分搭建的。
2.根据权利要求1所述的自动化信用评分系统,其特征在于,所述底层机构包括: 原始特征采集模块,用于汇总用户的原始特征数据,构造多个原始维度的R型数据,所述R型数据为与用户个人相关的原始信息; 用户特征拓展模块,用于根据所述R型数据的具体信息维度拓展其背后的含义,形成E型数据; 特征标准化模块,用于将所述E型数据转换为可作为评分模型输入的向量化数据,形成X型数据。
3.根据权利要求2所述的自动化信用评分系统,其特征在于,所述用户个人相关的原始信息包括用户提交的个人基本资料、工作信息、教育信息、家庭信息、财产信息,以及用户授权的来自第三方的用户社交信息、消费信息和用户使用APP的日志信息、从Web抓取的用户相关信息。
4.根据权利要求2所述的自动化信用评分系统,其特征在于,所述左脑机构包括: 规则库,为预先设定好的具有不同规则的模块,所述规则库中的每项规则为用户的一个特征维度或多个相关维度的组合; 特征精选模块,用于从所述底层机构的用户特征维度数据中精选出与信用相关的特征维度数据; 规则匹配模块,用于根据所述特征精选模块精选的用户特征维度完成对所述规则库中每项规则的匹配; 规则打分模块,用于把匹配到所述规则库中的每项特征维度数据转换成具体的分数; 总分校对模块,用于采用加和的方式汇总所述规则打分模块得出的每项特征维度数据相应的分数,最终得出用户的初步信用分。
5.根据权利要求2所述的自动化信用评分系统,其特征在于,所述自动化信用评分系统还包括: 用户原始数据存储模块,用于存储和管理由所述底层机构采集的R型数据、E型数据和X型数据; X7型数据生成和存储模块,用于对V型数据进行生成和存储;所述V型数据是在所述E型数据的基础上做局部微调,改动某个特征维度上的值,得到与原用户的信用情况相当的模拟用户数据; X〃型数据生成和存储模块,用于对X〃型数据进行生成和存储;所述X〃型数据是在X型数据的基础上随机挑选几个特征维度,通过改动、删除或增加几个特征维度,以扩充X型数据而得的模拟用户数据。
6.根据权利要求5所述的自动化信用评分系统,其特征在于,所述自动化信用评分系统还包括: Y型数据采集存储模块,用于采集和存储根据其他征信平台的信用记录、特殊的用户标签或用户的实际违约情况,经人工审核得出的Y型数据; Y7型数据存储模块,用于存储由所述左脑机构得出的V型数据;所述Y'型数据为所述左脑机构根据所述底层机构得出的X型数据,采用所述规则库的打分策略评估出的用户初步信用分。
7.根据权利要求6所述的自动化信用评分系统,其特征在于,所述Y'型数据为在所述X型数据、V型数据或X"型数据中筛选与信用较为相关的相同维度的特征数据输入所述左脑机构,采用所述规则库打分策略评估出的用户初步信用分。
8.根据权利要求7所述的自动化信用评分系统,其特征在于,所述自动化信用评分系统还包括: Z型数据补充模块:用于存储并管理Z型数据,且为所述右脑机构进行深度学习得出的用户信用分提供补充和校正作用;所述Z型数据是经人工评估得出的两个用户信用分大小关系或同一用户Y型数据与矿型数据得到的比较对。
9.一种基于深度学习机制的自动化信用评分方法,其特征在于,所述方法包括如下步骤: (1)用户特征数据的准备:通过汇总与用户个人相关的原始信息数据,构造R型数据;并通过对R型数据的具体信息维度进行拓展,得到E型数据;再通过标准化特征E型数据,形成特征向量化X型数据; (2)基于规则库的打分策略,为用户提供初步信用分:从上述步骤(I)中得到的用户特征数据中筛选与信用相关的用户特征维度数据;依托预先设定的规则库并采用打分策略得出用户的初步信用分,即矿型数据; (3)通过深度学习机制得出用户的最终信用分:基于上述步骤(I)中得到的用户特征数据进行无监督的学习,搭建无监督学习的下层网络;在所述下层网络的基础上,结合所述步骤(2)中得到的评分结果搭建有监督学习的上层网络,通过深度学习方法计算用户的最终信用分,即Y〃型数据。
10.根据权利要求9所述的自动化信用评分方法,其特征在于,所述步骤(I)中还包括V型数据和x〃型数据的生成步骤;所述V型数据是在所述E型数据的基础上做局部微调,改动某个特征维度上的值,而得到的与原用户信用情况相当的模拟用户数据;所述X"型数据是在所述X型数据的基础上随机挑选几个特征维度,通过改动、删除或增加几个特征维度,以扩充X型数据而得到的模拟用户数据; 所述步骤(2)中与信用相关的用户特征维度数据是从所述X型数据、X'型数据或X"型数据中筛选的与信用相关的相同维度的特征数据; 所述步骤(3)中还包括利用人工评估得出的信用分比较对对所述有监督学习的上层网络进行调参优化的步骤。
CN201610249083.7A 2016-04-20 2016-04-20 基于深度学习机制的自动化信用评分系统及方法 CN105931116A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610249083.7A CN105931116A (zh) 2016-04-20 2016-04-20 基于深度学习机制的自动化信用评分系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610249083.7A CN105931116A (zh) 2016-04-20 2016-04-20 基于深度学习机制的自动化信用评分系统及方法

Publications (1)

Publication Number Publication Date
CN105931116A true CN105931116A (zh) 2016-09-07

Family

ID=56839667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610249083.7A CN105931116A (zh) 2016-04-20 2016-04-20 基于深度学习机制的自动化信用评分系统及方法

Country Status (1)

Country Link
CN (1) CN105931116A (zh)

Similar Documents

Publication Publication Date Title
Coccia New models for measuring the R&D performance and identifying the productivity of public research institutes
Zavadskas et al. Multi-attribute decision-making model by applying grey numbers
Plummer et al. People matter: The importance of social capital in the co‐management of natural resources
Walker et al. Replacing members with managers? Mutualism among membership and nonmembership advocacy organizations in the United States
Kostka et al. Implementation and participation in China's local environmental politics: challenges and innovations
Leyden et al. A theoretical and empirical analysis of the decision to locate on a university research park
Yang Comparing policies
Kurian The water-energy-food nexus: trade-offs, thresholds and transdisciplinary approaches to sustainable development
CN102034176A (zh) 一种采用多种评价方法的通用综合评价系统
Sen The political dynamics of economic growth
Bode et al. State–third sector partnerships: A short overview of key issues in the debate
Yang General or vocational? The tough choice in the Chinese education policy
Rosso et al. Integrating multicriteria evaluation and stakeholders analysis for assessing hydropower projects
Borghesi et al. Global sustainability: Social and environmental conditions
Guillet et al. Interpreting the mind of multinational hotel investors: Future trends and implications in China
Castro Decentralization and modernization in Mexico: the management of water services
Hwang et al. The effect of the rural tourism policy on non-farm income in South Korea
Jenkins et al. Malawi
Carmona et al. Participatory modelling to support decision making in water management under uncertainty: two comparative case studies in the Guadiana river basin, Spain
Wolf et al. Urban forestry research needs: a participatory assessment process
Moscardo The role of knowledge in good governance for tourism
Wu et al. Estimating households’ preferences for environmental amenities using equilibrium models of local jurisdictions
Halbe et al. Governance of transitions towards sustainable development–the water–energy–food nexus in Cyprus
Legaspi The changing role of local government under a decentralized state: The case of the Philippines
Mudge et al. Fielding supranationalism: the European Central Bank as a field effect

Legal Events

Date Code Title Description
C06 Publication
C10 Entry into substantive examination