CN106127363B - 一种用户信用评估方法和装置 - Google Patents

一种用户信用评估方法和装置 Download PDF

Info

Publication number
CN106127363B
CN106127363B CN201610416661.1A CN201610416661A CN106127363B CN 106127363 B CN106127363 B CN 106127363B CN 201610416661 A CN201610416661 A CN 201610416661A CN 106127363 B CN106127363 B CN 106127363B
Authority
CN
China
Prior art keywords
user
offline
credit
real
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610416661.1A
Other languages
English (en)
Other versions
CN106127363A (zh
Inventor
陈培炫
陈谦
陈玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610416661.1A priority Critical patent/CN106127363B/zh
Publication of CN106127363A publication Critical patent/CN106127363A/zh
Priority to PCT/CN2017/085049 priority patent/WO2017215403A1/zh
Priority to EP17812514.2A priority patent/EP3471046A4/en
Priority to JP2018543338A priority patent/JP6732034B2/ja
Priority to KR1020187029224A priority patent/KR102178633B1/ko
Priority to US15/954,710 priority patent/US20180232805A1/en
Application granted granted Critical
Publication of CN106127363B publication Critical patent/CN106127363B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Technology Law (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种用户信用评估方法和装置,其中的所述方法包括:获取目标用户的离线特征信息,所述离线特征信息为按照预设更新周期进行更新的用户的特征信息;根据目标用户的离线特征信息以及预设的离线预测模型,计算目标用户的离线信用评分;获取目标用户的实时特征信息,所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息,所述预设时间范围小于所述预设更新周期;根据目标用户的实时特征信息以及预设的实时预测模型,计算目标用户的实时信用评分;根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型,计算目标用户的综合信用评分。采用本发明,可提高用户信用的评估准确性。

Description

一种用户信用评估方法和装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种用户信用评估方法和装置。
背景技术
近年来,随着互联网技术的飞速发展,人们越来越多的通过互联网进行各种数据业务,而用户的信用评估也成为了一个互联网技术领域的焦点问题。
现有技术中对用户的信用评估方式通常是通过收集用户的个人信息,然后通过统计模型或机器学习的一些预测算法,对用户违约风险进行预测,例如常用的FICO信用评分系统以及Zestfinace信用评价系统。现有的信用评分机制中采用的个人信息(大数据)通常都是按照预设更新周期进行更新,更新周期一般为一个月或更长,用户发生的状况要在下次更新时才能被参考,照成信息滞后,对用户信用的评估准确性带来非常大的影响。
发明内容
本发明实施例所要解决的技术问题在于,提供一种用户信用评估方法和装置,可避免信息更新周期带来的用户信息滞后,提高用户信用的评估准确性。
为了解决上述技术问题,本发明实施例提供了一种用户信用评估方法,所述方法包括:
获取目标用户的离线特征信息,所述离线特征信息为按照预设更新周期进行更新的用户的特征信息;
根据目标用户的离线特征信息以及预设的离线预测模型,计算目标用户的离线信用评分;
获取目标用户的实时特征信息,所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息,所述预设时间范围小于所述预设更新周期;
根据目标用户的实时特征信息以及预设的实时预测模型,计算目标用户的实时信用评分;
根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型,计算目标用户的综合信用评分。
相应地,本发明实施例还提供了一种用户信用评估装置,所述装置包括:
离线特征获取模块,用于获取目标用户的离线特征信息,所述离线特征信息为按照预设更新周期进行更新的用户的特征信息;
离线评分模块,用于根据目标用户的离线特征信息以及预设的离线预测模型,计算目标用户的离线信用评分;
实时特征获取模块,用于获取目标用户的实时特征信息,所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息,所述预设时间范围小于所述预设更新周期;
实时评分模块,用于根据目标用户的实时特征信息以及预设的实时预测模型,计算目标用户的实时信用评分;
综合评分模块,用于根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型,计算目标用户的综合信用评分。
本发明实施例中的用户信用评估装置通过获取用户的离线特征信息和实时特征信息,分别计算用户的离线信用评分和实时信用评分,从而计算用户的综合信用评分,实现了结合用户的长期特征数据和实时特征数据准确预测用户的信用状况,解决了现有技术中因此用户信息滞后造成的信用估计不准确的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中的一种用户信用评估方法的流程示意图;
图2是本发明实施例中获取用户的实时特征信息和离线特征信息的来源示意图;
图3是本发明实施例中对离线预测模型进行训练的流程示意图;
图4是本发明实施例中对实时预测模型进行训练的流程示意图;
图5是本发明实施例中对综合预测模型进行训练的流程示意图;
图6是本发明实施例中的一种用户信用评估装置的结构示意图;
图7是本发明实施例中的样本获取模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中的用户信用评估方法和装置,可以实现在如个人电脑、笔记本电脑、智能手机、平板电脑、电子阅读器等计算机系统中,较多的可以被采用在提供用户信用评估的服务器中,例如数据业务平台的后台服务器。下文均以用户信用评估装置作为本发明实施例的执行主体进行介绍。
图1是本发明实施例中的一种用户信用评估方法的流程示意图,如图所示本实施例中的用户信用评估方法流程可以包括:
S101,获取目标用户的离线特征信息,所述离线特征信息为按照预设更新周期进行更新的用户的特征信息。
所述离线特征信息如图2所示,用户信用评估装置可以通过采集来自第三方提供的用户数据得到,也可以通过业务平台采集得到的用户数据中获取得到。用户信用评估装置可以通过对上述得到的用户数据进行特征计算,将用户数据中的用户属性、用户行为或用户属性/行为的变化转换为统一格式的离线特征信息,例如数字化的特征信息。所述预设的更新周期,可以是外部厂商提供用户数据的更新周期,也可以是用户信用评估装置中自身设置的采集更新周期。由于大数据涉及庞大的用户基数,离线特征信息中可以包括用户所有的历史特征信息,数据量庞大,因此该预设的更新周期一般较长,通常至少为一周至一个月。在可选实施例中,所述离线特征信息可以为用户较为稳定的特征信息,例如性别、年龄、籍贯、职业、收入情况等属性,还可以包括所有的历史契约信用记录,对于此类通常较为稳定的用户特征信息,只需要按照预设更新周期进行更新即可,因此将这些特征类别的信息作为离线特征信息。
在可选实施例中,所述离线特征信息可以是经过筛选的特征类别的离线特征信息,即第三方提供的用户数据或业务平台采集得到的用户数据中可能包括多个特征类别的离线特征信息,用户信用评估装置可以从中筛选出指定特征类别的离线特征信息。所述指定的特征类别,可以是用户信用评估装置根据预设的训练样本数据,所述训练样本数据包括多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本,用户信用评估装置根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本,计算各个特征类别与信用评分结果之间的相关度,从而将与信用评分结果之间的相关度达到预设阈值的特征类别确定为指定的特征类别。
S102,根据目标用户的离线特征信息以及预设的离线预测模型,计算目标用户的离线信用评分。
所述离线预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。用户信用评估装置将目标用户的离线特征信息代入到所述预设的离线预测模型中,即可计算得到目标用户的离线信用评分。
所述离线预测模型可以是用户信用评估装置根据预设的训练样本数据训练得到的,所述训练样本数据可以包括多个用户的信用评分结果样本和各个用户的离线特征信息;所述离线预测模型还可以是用户信用评估装置从外部获取的经过训练的离线预测模型。
S103,获取目标用户的实时特征信息,所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息,所述预设时间范围小于所述预设更新周期。
所述实时特征信息如图2所示,用户信用评估装置可以通过业务平台采集得到的用户数据中获取得到。用户信用评估装置可以通过对得到的用户数据进行特征计算,将用户数据中的用户属性、用户行为或用户属性/行为的变化转换为统一格式的实时特征信息,例如数字化的特征信息。所述业务平台可以采集用户最新的特征信息,所述预设时间范围小于所述预设更新周期,例如最近一天、两天或一周内采集到的用户的特征信息。在可选实施例中,用户信用评估装置可以预先设定一些特征类别作为高风险特征,当用户这些高风险特征对应的特征信息发生变化时,将会对用户的信用评分带来很大的影响,例如用户办理了特定平台借贷业务、办理出国签证业务、所在地理位置发生变化或发生了特定领域的大额消费等,对于这些需要实时关注的高风险特征,用户信用评估装置可以将对应的特征信息作为用户的实时特征信息进行实时收集并录入,对于其他的特征信息作为离线特征信息进行预设更新周期的更新。
同样的,所述实时特征信息可以是经过筛选的特征类别的实时特征信息,即第三方提供的用户数据或业务平台采集得到的用户数据中可能包括多个特征类别的实时特征信息,用户信用评估装置可以从中筛选出指定特征类别的实时特征信息。所述指定的特征类别,可以是用户信用评估装置根据预设的训练样本数据,所述训练样本数据包括多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本,用户信用评估装置根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本,计算各个特征类别与信用评分结果之间的相关度,从而将与信用评分结果之间的相关度达到预设阈值的特征类别确定为指定的特征类别。
S104,根据目标用户的实时特征信息以及预设的实时预测模型,计算目标用户的实时信用评分。
所述实时预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。用户信用评估装置将目标用户的实时特征信息代入到所述预设的实时预测模型中,即可计算得到目标用户的实时信用评分。
所述实时预测模型可以是用户信用评估装置根据预设的训练样本数据训练得到的,所述训练样本数据可以包括多个用户的信用评分结果样本和各个用户的离线特征信息;所述实时预测模型还可以是用户信用评估装置从外部获取的经过训练的实时预测模型。
S105,根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型,计算目标用户的综合信用评分。
所述综合预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型、梯度提升决策树模型等。用户信用评估装置将目标用户的离线信用评分和实时信用评分代入到所述预设的实时预测模型中,即可计算得到目标用户的实时信用评分。
所述综合预测模型可以是用户信用评估装置根据预设的训练样本数据训练得到的,所述训练样本数据可以包括多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息,用户信用评估装置在使用离线预测模型根据用户的离线特征信息得到各个用户的离线信用评分,以及使用实时预测模型根据用户的实时特征信息得到各个用户的实时信用评分后,根据所述多个用户的信用评分结果以及各个用户的离线信用评分和实时信用评分对所述综合预测模型进行训练。所述实时预测模型还可以是用户信用评估装置从外部获取的经过训练的实时预测模型。
示例性的,可以采用下式逻辑回归算法的综合预测模型计算得到目标用户的实时信用评分:
Score=1/(1+exp(-(α*Score1+β*Score2+γ)))
其中α,β,γ为训练模型得到的参数,Score1和Score2分别为目标用户的离线信用评分和实时信用评分,结果Score为目标用户的综合信用评分。
进而在可选实施例中,用户信用评估装置可以根据经过本实施例上述步骤后计算得到的目标用户的综合信用评分为目标用户推送产品信息,例如推送金融产品信息、固定资产管理产品信息等;或根据目标用户的综合信用评分对目标用户的数据业务进行监控管理,例如对目标用户的借贷业务进行风控管理、对目标用户的流动资金进行管理建议等。
从而,本发明实施例中的用户信用评估装置通过获取用户的离线特征信息和实时特征信息,分别计算用户的离线信用评分和实时信用评分,从而计算用户的综合信用评分,实现了结合用户的长期特征数据和实时特征数据准确预测用户的信用状况,解决了现有技术中因此用户信息滞后造成的信用估计不准确的问题。
图3是本发明实施例中对离线预测模型进行训练的流程示意图,如图所示本实施例中的离线预测模型训练流程可以包括:
S301,获取多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本。
可选的,所述多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本可以根据输入至用户信用评估装置的训练样本数据中提取得到。
或者,所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到,即根据该多个用户是否违约,或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中,所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后,用户信用评估装置可以通过采集来自第三方提供的用户数据,或可以通过业务平台采集得到的用户数据中获取得到各个用户的多个特征类别的离线特征信息样本。
S302,根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本,计算各个特征类别与信用评分结果之间的相关度。
所述特征类别可以例如年龄、所在地、性别、职业等,特征类别与信用评分结果之间的相关度,反应的是如年龄、性别、职业等对于用户信用评分结果的影响,如果相关度较高,则表示该特征类别对于信用评分结果影响较大,反之则是对信用评分结果影响很小,可以在建立离线预测模型时,不考虑该特征类别的离线特征信息。
具体的,所述各个特征类别与信用评分结果之间的相关度,示例性地可以采用下式计算相关度r:
Figure BDA0001017056820000071
其中x为某个特征类别的离线特征信息,y为用户的信用评分结果.下标i则表示对应不同的用户。
在其他可选实施例中,还可以采用IV值、卡方值等相关度算法计算所述各个特征类别与信用评分结果之间的相关度。
S303,将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述离线特征信息的特征类别,并从所述各个用户的多个特征类别的离线特征信息样本中筛选出对应特征类别的离线特征信息。
在计算得到各个特征类别与信用评分结果之间的相关度后,可以与相应的预设阈值进行比较后,将相关度达到要求的特征类别确定所述离线特征信息的特征类别,并从所述各个用户的多个特征类别的离线特征信息样本中筛选出对应特征类别的离线特征信息。
S304,根据经过筛选的对应特征类别的用户的离线特征信息建立离线预测模型,并根据所述多个用户的信用评分结果样本和各个用户的对应特征类别的离线特征信息对离线预测模型进行训练
所述离线预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。所述离线预测模型可以是用户信用评估装置根据经过筛选的对应特征类别的用户的离线特征信息结合特定的模型参数计算用户的信用评分的一个预测算式,通过所述多个用户的信用评分结果样本和各个用户的对应特征类别的离线特征信息对该预测算式中的模型参数进行训练迭代,从而可以得到最接近信用评分结果样本的预测算式的模型参数,从而得到经过训练的离线预测模型。
需要指出的是,上述S302和S303为可选步骤,在可选实施例中可以不经筛选的将获取到的各个用户的多个特征类别的离线特征信息样本都作为离线特征信息进行实时预测模型的训练。
图4是本发明实施例中对实时预测模型进行训练的流程示意图,如图所示本实施例中的实时预测模型训练流程可以包括:
S401,获取多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本。
可选的,所述多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本可以根据输入至用户信用评估装置的训练样本数据中提取得到。
或者,所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到,即根据该多个用户是否违约,或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中,所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后,用户信用评估装置可以获取业务平台采集得到的用户数据中获取得到各个用户的多个特征类别的实时特征信息样本。
S402,根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本,计算各个特征类别与信用评分结果之间的相关度。
所述特征类别可以例如年龄、所在地、性别、职业等,特征类别与信用评分结果之间的相关度,反应的是如年龄、性别、职业等对于用户信用评分结果的影响,如果相关度较高,则表示该特征类别对于信用评分结果影响较大,反之则是对信用评分结果影响很小,可以在建立实时预测模型时,不考虑该特征类别的实时特征信息。
具体的,所述各个特征类别与信用评分结果之间的相关度,示例性地可以采用下式计算相关度s:
Figure BDA0001017056820000091
其中z为某个特征类别的实时特征信息,y为用户的信用评分结果.下标i则表示对应不同的用户。
在其他可选实施例中,还可以采用IV值、卡方值等相关度算法计算所述各个特征类别的实时特征信息与信用评分结果之间的相关度。
S403,将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述实时特征信息的特征类别,并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。
在计算得到各个特征类别与信用评分结果之间的相关度后,可以与相应的预设阈值进行比较后,将相关度达到要求的特征类别确定所述实时特征信息的特征类别,并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。
S404,根据经过筛选的对应特征类别的用户的实时特征信息建立实时预测模型,并根据所述多个用户的信用评分结果样本和各个用户的对应特征类别的实时特征信息对实时预测模型进行训练
所述实时预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。所述实时预测模型可以是用户信用评估装置根据经过筛选的对应特征类别的用户的实时特征信息结合特定的模型参数计算用户的信用评分的一个预测算式,通过所述多个用户的信用评分结果样本和各个用户的对应特征类别的实时特征信息对该预测算式中的模型参数进行训练迭代,从而可以得到最接近信用评分结果样本的预测算式的模型参数,从而得到经过训练的实时预测模型。
需要指出的是,上述S402和S403为可选步骤,在可选实施例中可以不经筛选的将获取到的各个用户的多个特征类别的实时特征信息样本都作为实时特征信息进行实时预测模型的训练。
图5是本发明实施例中对综合预测模型进行训练的流程示意图。
S501,获取多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息。
可选的,所述多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息可以根据输入至用户信用评估装置的训练样本数据中提取得到。
或者,所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到,即根据该多个用户是否违约,或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中,所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后,用户信用评估装置可以通过采集来自第三方提供的用户数据,或可以通过业务平台采集得到的用户数据中获取得到各个用户的多个特征类别的实时特征信息样本。
S502,根据所述各个用户的离线特征信息以及预设的离线预测模型,计算所述各个用户的离线信用评分。
S503,根据所述各个用户的实时特征信息以及预设的实时预测模型,计算所述各个用户的实时信用评分。
S504,根据用户的离线信用评分和实时信用评分建立所述综合预测模型,并根据所述多个用户的信用评分结果以及各个用户的离线信用评分和实时信用评分对所述综合预测模型进行训练。
所述综合预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型、梯度提升决策树模型等。所述综合预测模型可以是用户信用评估装置根据用户的离线信用评分和实时信用评分结合特定的模型参数计算用户的综合信用评分的一个预测算式,通过所述多个用户的信用评分结果样本和计算得到的各个用户的离线信用评分和实时信用评分可以对该预测算式中的模型参数进行训练迭代,从而可以得到最接近信用评分结果样本的预测算式的模型参数,从而得到经过训练的综合预测模型。
示例性的,可以采用下式逻辑回归算法的综合预测模型计算得到目标用户的实时信用评分:
Score=1/(1+exp(-(α*Score1+β*Score2+γ)))
其中α,β,γ为训练模型得到的参数,Score1和Score2分别为目标用户的离线信用评分和实时信用评分,结果Score为目标用户的综合信用评分。
图6是本发明一种用户信用评估装置的结构示意图,如图所示本发明实施例中的用户信用评估装置可以包括:
离线特征获取模块610,用于获取目标用户的离线特征信息,所述离线特征信息为按照预设更新周期进行更新的用户的特征信息。
所述离线特征信息如图2所示,离线特征获取模块610可以通过采集来自第三方提供的用户数据得到,也可以通过业务平台采集得到的用户数据中获取得到。离线特征获取模块610可以通过对上述得到的用户数据进行特征计算,将用户数据中的用户属性、用户行为或用户属性/行为的变化转换为统一格式的离线特征信息,例如数字化的特征信息。所述预设的更新周期,可以是外部厂商提供用户数据的更新周期,也可以是离线特征获取模块610中自身设置的采集更新周期。由于大数据涉及庞大的用户基数,离线特征信息中可以包括用户所有的历史特征信息,数据量庞大,因此该预设的更新周期一般较长,通常至少为一周至一个月。在可选实施例中,所述离线特征信息可以为用户较为稳定的特征信息,例如性别、年龄、籍贯、职业、收入情况等属性,还可以包括所有的历史契约信用记录,对于此类通常较为稳定的用户特征信息,只需要按照预设更新周期进行更新即可,因此将这些特征类别的信息作为离线特征信息。
在可选实施例中,所述离线特征信息可以是经过筛选的特征类别的离线特征信息,即第三方提供的用户数据或业务平台采集得到的用户数据中可能包括多个特征类别的离线特征信息,离线特征获取模块610可以从中筛选出指定特征类别的离线特征信息。所述指定的特征类别,可以是用户信用评估装置根据预设的训练样本数据,所述训练样本数据包括多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本,用户信用评估装置根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本,计算各个特征类别与信用评分结果之间的相关度,从而将与信用评分结果之间的相关度达到预设阈值的特征类别确定为指定的特征类别。
离线评分模块620,用于根据目标用户的离线特征信息以及预设的离线预测模型,计算目标用户的离线信用评分。
所述离线预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。离线评分模块620将目标用户的离线特征信息代入到所述预设的离线预测模型中,即可计算得到目标用户的离线信用评分。
所述离线预测模型可以是用户信用评估装置根据预设的训练样本数据训练得到的,所述训练样本数据可以包括多个用户的信用评分结果样本和各个用户的离线特征信息;所述离线预测模型还可以是用户信用评估装置从外部获取的经过训练的离线预测模型。
实时特征获取模块630,用于获取目标用户的实时特征信息,所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息,所述预设时间范围小于所述预设更新周期。
所述实时特征信息如图2所示,实时特征获取模块630可以通过业务平台采集得到的用户数据中获取得到。实时特征获取模块630可以通过对得到的用户数据进行特征计算,将用户数据中的用户属性、用户行为或用户属性/行为的变化转换为统一格式的实时特征信息,例如数字化的特征信息。所述业务平台可以采集用户最新的特征信息,所述预设时间范围小于所述预设更新周期,例如最近一天、两天或一周内采集到的用户的特征信息。在可选实施例中,用户信用评估装置可以预先设定一些特征类别作为高风险特征,当用户这些高风险特征对应的特征信息发生变化时,将会对用户的信用评分带来很大的影响,例如用户办理了特定平台借贷业务、办理出国签证业务、所在地理位置发生变化或发生了特定领域的大额消费等,对于这些需要实时关注的高风险特征,实时特征获取模块630可以将对应的特征信息作为用户的实时特征信息进行实时收集并录入,对于其他的特征信息作为离线特征信息进行预设更新周期的更新。
同样的,所述实时特征信息可以是经过筛选的特征类别的实时特征信息,即第三方提供的用户数据或业务平台采集得到的用户数据中可能包括多个特征类别的实时特征信息,实时特征获取模块630可以从中筛选出指定特征类别的实时特征信息。所述指定的特征类别,可以是用户信用评估装置根据预设的训练样本数据,所述训练样本数据包括多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本,用户信用评估装置根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本,计算各个特征类别与信用评分结果之间的相关度,从而将与信用评分结果之间的相关度达到预设阈值的特征类别确定为指定的特征类别。
实时评分模块640,用于根据目标用户的实时特征信息以及预设的实时预测模型,计算目标用户的实时信用评分。
所述实时预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。用户信用评估装置将目标用户的实时特征信息代入到所述预设的实时预测模型中,即可计算得到目标用户的实时信用评分。
所述实时预测模型可以是用户信用评估装置根据预设的训练样本数据训练得到的,所述训练样本数据可以包括多个用户的信用评分结果样本和各个用户的离线特征信息;所述实时预测模型还可以是用户信用评估装置从外部获取的经过训练的实时预测模型。
综合评分模块650,用于根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型,计算目标用户的综合信用评分。
所述综合预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型、梯度提升决策树模型等。综合评分模块650将目标用户的离线信用评分和实时信用评分代入到所述预设的实时预测模型中,即可计算得到目标用户的实时信用评分。
所述综合预测模型可以是用户信用评估装置根据预设的训练样本数据训练得到的,所述训练样本数据可以包括多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息,用户信用评估装置在使用离线预测模型根据用户的离线特征信息得到各个用户的离线信用评分,以及使用实时预测模型根据用户的实时特征信息得到各个用户的实时信用评分后,根据所述多个用户的信用评分结果以及各个用户的离线信用评分和实时信用评分对所述综合预测模型进行训练。所述实时预测模型还可以是用户信用评估装置从外部获取的经过训练的实时预测模型。
示例性的,可以采用下式逻辑回归算法的综合预测模型计算得到目标用户的实时信用评分:
Score=1/(1+exp(-(α*Score1+β*Score2+γ)))
其中α,β,γ为训练模型得到的参数,Score1和Score2分别为目标用户的离线信用评分和实时信用评分,结果Score为目标用户的综合信用评分。
在可选实施例中,所述用户信用评估装置还可以包括:
样本获取模块660,用于获取多个用户的信用评分结果样本和各个用户的离线特征信息。
可选的,所述多个用户的信用评分结果样本和各个用户的离线特征信息可以根据输入至用户信用评估装置的训练样本数据中提取得到。
或者,所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到,即根据该多个用户是否违约,或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中,所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后,样本获取模块660可以通过采集来自第三方提供的用户数据,或可以通过业务平台采集得到的用户数据中获取得到各个用户的离线特征信息。
离线模型训练模块670,用于根据用户的离线特征信息建立所述离线预测模型,并根据所述多个用户的信用评分结果样本和各个用户的离线特征信息对所述离线预测模型进行训练。
所述离线预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。所述离线预测模型可以是根据经过筛选的对应特征类别的用户的离线特征信息结合特定的模型参数计算用户的信用评分的一个预测算式,离线模型训练模块670通过所述多个用户的信用评分结果样本和各个用户的对应特征类别的离线特征信息对该预测算式中的模型参数进行训练迭代,从而可以得到最接近信用评分结果样本的预测算式的模型参数,从而得到经过训练的离线预测模型。
进而可选的,所述样本获取模块660如图7所示进一步可以包括:
离线样本获取单元661,用于获取多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本;
相关度计算单元663,用于根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本,计算各个特征类别与信用评分结果之间的相关度;
所述特征类别可以例如年龄、所在地、性别、职业等,特征类别与信用评分结果之间的相关度,反应的是如年龄、性别、职业等对于用户信用评分结果的影响,如果相关度较高,则表示该特征类别对于信用评分结果影响较大,反之则是对信用评分结果影响很小,可以在建立离线预测模型时,不考虑该特征类别的离线特征信息。
具体的,所述各个特征类别与信用评分结果之间的相关度,示例性地可以采用下式计算相关度r:
Figure BDA0001017056820000151
其中x为某个特征类别的离线特征信息,y为用户的信用评分结果.下标i则表示对应不同的用户。
在其他可选实施例中,还可以采用IV值、卡方值等相关度算法计算所述各个特征类别与信用评分结果之间的相关度。
特征类别筛选单元665,用于将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述离线特征信息的特征类别,并从所述各个用户的多个特征类别的离线特征信息样本中筛选出对应特征类别的离线特征信息。
在可选实施例中,所述样本获取模块660,用于获取多个用户的信用评分结果样本和各个用户的实时特征信息;
可选的,所述多个用户的信用评分结果样本和各个用户的实时特征信息可以根据输入至用户信用评估装置的训练样本数据中提取得到。
或者,所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到,即根据该多个用户是否违约,或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中,所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后,用户信用评估装置可以获取业务平台采集得到的用户数据中获取得到各个用户的实时特征信息。
所述用户信用评估装置还可以包括:
实时模型训练模块680,用于根据用户的实时特征信息建立所述实时预测模型,并根据所述多个用户的信用评分结果样本和各个用户的实时特征信息对所述实时预测模型进行训练。
所述实时预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。所述实时预测模型可以是用户信用评估装置根据经过筛选的对应特征类别的用户的实时特征信息结合特定的模型参数计算用户的信用评分的一个预测算式,实时模型训练模块680通过所述多个用户的信用评分结果样本和各个用户的对应特征类别的实时特征信息对该预测算式中的模型参数进行训练迭代,从而可以得到最接近信用评分结果样本的预测算式的模型参数,从而得到经过训练的实时预测模型。
进而可选的,所述样本获取模块如图7所示进一步可以包括:
实时样本获取单元662,用于获取多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本。
相关度计算单元663,用于根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本,计算各个特征类别与信用评分结果之间的相关度。
所述特征类别可以例如年龄、所在地、性别、职业等,特征类别与信用评分结果之间的相关度,反应的是如年龄、性别、职业等对于用户信用评分结果的影响,如果相关度较高,则表示该特征类别对于信用评分结果影响较大,反之则是对信用评分结果影响很小,可以在建立实时预测模型时,不考虑该特征类别的实时特征信息。
具体的,所述各个特征类别与信用评分结果之间的相关度,示例性地可以采用下式计算相关度s:
Figure BDA0001017056820000171
其中z为某个特征类别的实时特征信息,y为用户的信用评分结果.下标i则表示对应不同的用户。
在其他可选实施例中,还可以采用IV值、卡方值等相关度算法计算所述各个特征类别的实时特征信息与信用评分结果之间的相关度。
特征类别筛选单元665,用于将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述实时特征信息的特征类别,并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。
在计算得到各个特征类别与信用评分结果之间的相关度后,特征类别筛选单元665可以与相应的预设阈值进行比较后,将相关度达到要求的特征类别确定所述实时特征信息的特征类别,并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。
在可选实施例中,所述样本获取模块660,用于获取多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息。
可选的,所述多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息可以根据输入至用户信用评估装置的训练样本数据中提取得到。
或者,所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到,即根据该多个用户是否违约,或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中,所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后,所述样本获取模块660可以通过采集来自第三方提供的用户数据,或可以通过业务平台采集得到的用户数据中获取得到各个用户的多个特征类别的实时特征信息样本。
所述离线评分模块620,还用于根据所述各个用户的离线特征信息以及预设的离线预测模型,计算所述各个用户的离线信用评分;
所述实时评分模块640,还用于根据所述各个用户的实时特征信息以及预设的实时预测模型,计算所述各个用户的实时信用评分;
所述用户信用评估装置还可以包括:
综合模型训练模块690,用于根据用户的离线信用评分和实时信用评分建立所述综合预测模型,并根据所述多个用户的信用评分结果以及各个用户的离线信用评分和实时信用评分对所述综合预测模型进行训练。
所述综合预测模型,可以是经过训练的逻辑回归分类模型,也可以是经过训练的集成学习模型、深度学习模型、随机森林模型、梯度提升决策树模型等。所述综合预测模型可以是用户信用评估装置根据用户的离线信用评分和实时信用评分结合特定的模型参数计算用户的综合信用评分的一个预测算式,通过所述多个用户的信用评分结果样本和计算得到的各个用户的离线信用评分和实时信用评分可以对该预测算式中的模型参数进行训练迭代,从而可以得到最接近信用评分结果样本的预测算式的模型参数,从而得到经过训练的综合预测模型。
示例性的,可以采用下式逻辑回归算法的综合预测模型计算得到目标用户的实时信用评分:
Score=1/(1+exp(-(α*Score1+β*Score2+γ)))
其中α,β,γ为训练模型得到的参数,Score1和Score2分别为目标用户的离线信用评分和实时信用评分,结果Score为目标用户的综合信用评分。
进而在可选实施例中,所述用户信用评估装置还可以包括信息推送模块6100或业务监控模块6110,其中:
信息推送模块6100,用于根据目标用户的综合信用评分为目标用户推送产品信息,即根据经过本发明实施例的综合评分模块650计算得到的目标用户的综合信用评分为目标用户推送产品信息,例如推送金融产品信息、固定资产管理产品信息等。
业务监控模块6110,用于根据目标用户的综合信用评分对目标用户的数据业务进行监控管理,例如对目标用户的借贷业务进行风控管理、对目标用户的流动资金进行管理建议等。
从而,本发明实施例中的用户信用评估装置通过获取用户的离线特征信息和实时特征信息,分别计算用户的离线信用评分和实时信用评分,从而计算用户的综合信用评分,实现了结合用户的长期特征数据和实时特征数据准确预测用户的信用状况,解决了现有技术中因此用户信息滞后造成的信用估计不准确的问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (16)

1.一种用户的综合信用评分的应用方法,其特征在于,应用于提供用户信用评估的服务器中,所述方法包括:
获取目标用户的离线特征信息,所述离线特征信息为按照预设更新周期进行更新的用户的特征信息,所述离线特征信息是指对用户的信用评分产生影响的第一类风险特征,包括以下至少一种:年龄、性别、籍贯、收入、职业、历史契约信用记录;所述第一类风险特征具有稳定性;
根据目标用户的离线特征信息以及预设的离线预测模型,计算目标用户的离线信用评分,所述离线信用评分是利用所述离线预测模型对所述离线特征信息进行计算得到的,所述离线信用评分用于表示目标用户签订契约后的违约风险;
获取目标用户的实时特征信息,所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息,所述预设时间范围小于所述预设更新周期,所述实时特征信息是指对用户的信用评分产生影响的第二类风险特征,包括以下至少一种:办理特定平台借贷业务、办理出国签证业务、所在地理位置发生变化、发生特定领域的大额消费;所述第二类风险特征具有突发性;
根据目标用户的实时特征信息以及预设的实时预测模型,计算目标用户的实时信用评分;
根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型,计算目标用户的综合信用评分;
根据目标用户的综合信用评分为目标用户推送产品信息,或根据目标用户的综合信用评分对目标用户的数据业务进行监控管理;
其中,所述获取目标用户的离线特征信息,包括:
从第三方平台和/或业务平台采集目标用户的离线用户数据;
通过对所述离线用户数据进行特征计算,将所述离线用户数据中的用户属性、用户行为或用户属性/行为的变化转换为统一格式的离线特征信息;
其中,所述离线预测模型是根据用户的离线特征信息结合特定的模型参数计算用户的信用评分的一个预测算式,所述离线预测模型是利用训练样本数据进行训练得到的,所述训练样本数据包括多个用户的信用评分结果样本和各个用户的离线特征信息;利用所述训练样本数据训练得到离线预测模型,包括:通过所述多个用户的信用评分结果样本和各个用户的离线特征信息对所述预测算式中的模型参数进行训练迭代,确定目标模型参数;根据所述目标模型参数确定经过训练的离线预测模型;其中,利用所述经过训练的离线预测模型对用户的离线特征信息进行计算得到的信用评分结果,与相应的信用评分结果样本之间的差值小于或等于目标数值。
2.如权利要求1所述的用户的综合信用评分的应用方法,其特征在于,所述获取目标用户的离线特征信息之前还包括:
获取多个用户的信用评分结果样本和各个用户的离线特征信息;
根据用户的离线特征信息建立所述离线预测模型,并根据所述多个用户的信用评分结果样本和各个用户的离线特征信息对所述离线预测模型进行训练。
3.如权利要求2所述的用户的综合信用评分的应用方法,其特征在于,所述获取多个用户的信用评分结果样本和各个用户的离线特征信息包括:
获取多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本;
根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本,计算各个特征类别与信用评分结果之间的相关度;
将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述离线特征信息的特征类别,并从所述各个用户的多个特征类别的离线特征信息样本中筛选出对应特征类别的离线特征信息。
4.如权利要求1所述的用户的综合信用评分的应用方法,其特征在于,所述获取用户的实时特征信息之前还包括:
获取多个用户的信用评分结果样本和各个用户的实时特征信息;
根据用户的实时特征信息建立所述实时预测模型,并根据所述多个用户的信用评分结果样本和各个用户的实时特征信息对所述实时预测模型进行训练。
5.如权利要求4所述的用户的综合信用评分的应用方法,其特征在于,所述获取多个用户的信用评分结果样本和各个用户的实时特征信息包括:
获取多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本;
根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本,计算各个特征类别与信用评分结果之间的相关度;
将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述实时特征信息的特征类别,并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。
6.如权利要求1所述的用户的综合信用评分的应用方法,其特征在于,所述根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型,计算目标用户的综合信用评分之前还包括:
获取多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息;
根据所述各个用户的离线特征信息以及预设的离线预测模型,计算所述各个用户的离线信用评分;
根据所述各个用户的实时特征信息以及预设的实时预测模型,计算所述各个用户的实时信用评分;
根据用户的离线信用评分和实时信用评分建立所述综合预测模型,并根据所述多个用户的信用评分结果以及各个用户的离线信用评分和实时信用评分对所述综合预测模型进行训练。
7.如权利要求1所述的用户的综合信用评分的应用方法,其特征在于,所述实时特征信息包括业务平台采集得到的用户数据;
所述离线特征信息包括第三方提供的用户数据或业务平台采集得到的用户数据。
8.如权利要求1-7中任一项所述的用户的综合信用评分的应用方法,其特征在于,所述根据目标用户的综合信用评分为目标用户推送产品信息包括推送金融产品信息或固定资产管理产品信息;或
所述根据目标用户的综合信用评分对目标用户的数据业务进行监控管理包括对目标用户的借贷业务进行风控管理或对目标用户的流动资金进行管理建议。
9.一种用户的综合信用评分的应用装置,其特征在于,应用于提供用户信用评估的服务器中,所述装置包括:
离线特征获取模块,用于获取目标用户的离线特征信息,所述离线特征信息为按照预设更新周期进行更新的用户的特征信息,所述离线特征信息是指对用户的信用评分产生影响的第一类风险特征,包括以下至少一种:年龄、性别、籍贯、收入、职业、历史契约信用记录;所述第一类风险特征具有稳定性;
离线评分模块,用于根据目标用户的离线特征信息以及预设的离线预测模型,计算目标用户的离线信用评分,所述离线信用评分是利用所述离线预测模型对所述离线特征信息进行计算得到的,所述离线信用评分用于表示目标用户签订契约后的违约风险;
实时特征获取模块,用于获取目标用户的实时特征信息,所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息,所述预设时间范围小于所述预设更新周期,所述实时特征信息是指对用户的信用评分产生影响的第二类风险特征,包括以下至少一种:办理特定平台借贷业务、办理出国签证业务、所在地理位置发生变化、发生特定领域的大额消费;所述第二类风险特征具有突发性;
实时评分模块,用于根据目标用户的实时特征信息以及预设的实时预测模型,计算目标用户的实时信用评分;
综合评分模块,用于根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型,计算目标用户的综合信用评分;
信息推送模块,用于根据目标用户的综合信用评分为目标用户推送产品信息;或业务监控模块,用于根据目标用户的综合信用评分对目标用户的数据业务进行监控管理;
其中,所述离线特征获取模块获取目标用户的离线特征信息时,具体用于:
从第三方平台和/或业务平台采集目标用户的离线用户数据;
通过对所述离线用户数据进行特征计算,将所述离线用户数据中的用户属性、用户行为或用户属性/行为的变化转换为统一格式的离线特征信息;
其中,所述离线预测模型是根据用户的离线特征信息结合特定的模型参数计算用户的信用评分的一个预测算式,所述离线预测模型是利用训练样本数据进行训练得到的,所述训练样本数据包括多个用户的信用评分结果样本和各个用户的离线特征信息;所述装置还包括模型训练模块,具体用于:通过所述多个用户的信用评分结果样本和各个用户的离线特征信息对所述预测算式中的模型参数进行训练迭代,确定目标模型参数;根据所述目标模型参数确定经过训练的离线预测模型;其中,利用所述经过训练的离线预测模型对用户的离线特征信息进行计算得到的信用评分结果,与相应的信用评分结果样本之间的差值小于或等于目标数值。
10.如权利要求9所述的用户的综合信用评分的应用装置,其特征在于,还包括:
样本获取模块,用于获取多个用户的信用评分结果样本和各个用户的离线特征信息;
离线模型训练模块,用于根据用户的离线特征信息建立所述离线预测模型,并根据所述多个用户的信用评分结果样本和各个用户的离线特征信息对所述离线预测模型进行训练。
11.如权利要求10所述的用户的综合信用评分的应用装置,其特征在于,所述样本获取模块包括:
离线样本获取单元,用于获取多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本;
相关度计算单元,用于根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本,计算各个特征类别与信用评分结果之间的相关度;
特征类别筛选单元,用于将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述离线特征信息的特征类别,并从所述各个用户的多个特征类别的离线特征信息样本中筛选出对应特征类别的离线特征信息。
12.如权利要求9所述的用户的综合信用评分的应用装置,其特征在于,还包括:
样本获取模块,用于获取多个用户的信用评分结果样本和各个用户的实时特征信息;
实时模型训练模块,用于根据用户的实时特征信息建立所述实时预测模型,并根据所述多个用户的信用评分结果样本和各个用户的实时特征信息对所述实时预测模型进行训练。
13.如权利要求12所述的用户的综合信用评分的应用装置,其特征在于,所述样本获取模块包括:
实时样本获取单元,用于获取多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本;
相关度计算单元,用于根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本,计算各个特征类别与信用评分结果之间的相关度;
特征类别筛选单元,用于将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述实时特征信息的特征类别,并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。
14.如权利要求9所述的用户的综合信用评分的应用装置,其特征在于,还包括:
样本获取模块,获取多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息;
所述离线评分模块,还用于根据所述各个用户的离线特征信息以及预设的离线预测模型,计算所述各个用户的离线信用评分;
所述实时评分模块,还用于根据所述各个用户的实时特征信息以及预设的实时预测模型,计算所述各个用户的实时信用评分;
综合模型训练模块,用于根据用户的离线信用评分和实时信用评分建立所述综合预测模型,并根据所述多个用户的信用评分结果以及各个用户的离线信用评分和实时信用评分对所述综合预测模型进行训练。
15.如权利要求9所述的用户的综合信用评分的应用装置,其特征在于,所述实时特征信息为业务平台采集得到的用户数据;
所述离线特征信息包括第三方提供的用户数据和业务平台采集得到的用户数据。
16.如权利要求9-15中任一项所述的用户的综合信用评分的应用装置,其特征在于,所述信息推送模块具体用于根据目标用户的综合信用评分为目标用户推送金融产品信息或固定资产管理产品信息;或
所述业务监控模块具体用于根据目标用户的综合信用评分对目标用户的借贷业务进行风控管理或对目标用户的流动资金进行管理建议。
CN201610416661.1A 2016-06-12 2016-06-12 一种用户信用评估方法和装置 Active CN106127363B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201610416661.1A CN106127363B (zh) 2016-06-12 2016-06-12 一种用户信用评估方法和装置
PCT/CN2017/085049 WO2017215403A1 (zh) 2016-06-12 2017-05-19 一种用户信用评估方法、装置及存储介质
EP17812514.2A EP3471046A4 (en) 2016-06-12 2017-05-19 METHOD AND APPARATUS FOR EVALUATING USER CREDIT, AND STORAGE MEDIUM
JP2018543338A JP6732034B2 (ja) 2016-06-12 2017-05-19 ユーザー・クレジット評価方法、装置及び記憶媒体
KR1020187029224A KR102178633B1 (ko) 2016-06-12 2017-05-19 사용자 신용 평가 방법 및 장치, 그리고 저장 매체
US15/954,710 US20180232805A1 (en) 2016-06-12 2018-04-17 User credit rating method and apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610416661.1A CN106127363B (zh) 2016-06-12 2016-06-12 一种用户信用评估方法和装置

Publications (2)

Publication Number Publication Date
CN106127363A CN106127363A (zh) 2016-11-16
CN106127363B true CN106127363B (zh) 2022-04-15

Family

ID=57269931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610416661.1A Active CN106127363B (zh) 2016-06-12 2016-06-12 一种用户信用评估方法和装置

Country Status (6)

Country Link
US (1) US20180232805A1 (zh)
EP (1) EP3471046A4 (zh)
JP (1) JP6732034B2 (zh)
KR (1) KR102178633B1 (zh)
CN (1) CN106127363B (zh)
WO (1) WO2017215403A1 (zh)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127363B (zh) * 2016-06-12 2022-04-15 腾讯科技(深圳)有限公司 一种用户信用评估方法和装置
CN108074122A (zh) * 2016-11-18 2018-05-25 腾讯科技(深圳)有限公司 产品试用推荐方法、装置及服务器
CN108416662B (zh) * 2017-02-10 2021-09-21 腾讯科技(深圳)有限公司 一种数据验证方法及装置
CN107330445B (zh) * 2017-05-31 2020-06-05 北京京东尚科信息技术有限公司 用户属性的预测方法和装置
CN107766418A (zh) * 2017-09-08 2018-03-06 广州汪汪信息技术有限公司 一种基于融合模型的信用评估方法、电子设备和存储介质
CN109559214A (zh) * 2017-09-27 2019-04-02 阿里巴巴集团控股有限公司 虚拟资源分配、模型建立、数据预测方法及装置
US11823258B2 (en) * 2017-10-11 2023-11-21 Mx Technologies, Inc. Aggregation based credit decision
CN107993140A (zh) * 2017-11-22 2018-05-04 深圳市耐飞科技有限公司 一种个人信贷风险评估方法及系统
CN107944738A (zh) * 2017-12-07 2018-04-20 税友软件集团股份有限公司 一种税务信用积分计算方法及装置
CN110322334A (zh) * 2018-03-29 2019-10-11 上海麦子资产管理集团有限公司 信用评级方法及装置、计算机可读存储介质、终端
CN108846687A (zh) * 2018-04-02 2018-11-20 平安科技(深圳)有限公司 客户分类方法、装置及存储介质
CN110634060A (zh) * 2018-06-21 2019-12-31 马上消费金融股份有限公司 一种用户信用风险的评估方法、系统、装置及存储介质
CN109191096A (zh) * 2018-08-22 2019-01-11 阿里巴巴集团控股有限公司 一种签约风险量化方法、代扣风险量化方法、装置及设备
CN109461016B (zh) * 2018-09-10 2023-05-05 平安科技(深圳)有限公司 数据评分方法、装置、计算机设备及存储介质
CN111340265A (zh) * 2018-12-19 2020-06-26 北京嘀嘀无限科技发展有限公司 司机下线干预方法、装置、电子设备和计算机存储介质
WO2020191057A1 (en) * 2019-03-18 2020-09-24 Zestfinance, Inc. Systems and methods for model fairness
CN110060144B (zh) * 2019-03-18 2024-01-30 平安科技(深圳)有限公司 额度模型训练方法、额度评估方法、装置、设备及介质
CN110135972A (zh) * 2019-04-23 2019-08-16 上海淇玥信息技术有限公司 一种提高用户动支率的方法、装置、系统和记录介质
CN110222894A (zh) * 2019-06-06 2019-09-10 阿里巴巴集团控股有限公司 广告投放方法、装置及设备
CN110322343A (zh) * 2019-07-02 2019-10-11 上海上湖信息技术有限公司 一种用户全生命周期信用预测方法、装置和计算机设备
KR102156757B1 (ko) * 2019-09-27 2020-09-16 (주)데이터리퍼블릭 기계 학습을 이용한 신용 평가를 위한 시스템, 방법, 및 컴퓨터 프로그램
CN110889759A (zh) * 2019-11-21 2020-03-17 北京三快在线科技有限公司 信用数据的确定方法、装置及存储介质
CN111027935A (zh) * 2019-12-10 2020-04-17 支付宝(杭州)信息技术有限公司 基于信用的电子签证申请方法以及装置
CN111339134B (zh) * 2020-02-11 2024-03-08 广州拉卡拉信息技术有限公司 一种数据查询方法及装置
CN111598275B (zh) * 2020-04-03 2022-11-11 福建星云电子股份有限公司 一种电动汽车信用分评测方法、装置、设备和介质
CN111738549A (zh) * 2020-05-21 2020-10-02 平安国际智慧城市科技股份有限公司 食品安全风险评估方法、装置、设备及存储介质
KR102385054B1 (ko) 2020-05-26 2022-04-08 주식회사 다날 인공지능 기반의 신용등급 변동 예측 처리 장치 및 그 동작 방법
CN111666191B (zh) * 2020-06-09 2023-09-29 贝壳技术有限公司 数据质量监控方法、装置、电子设备及存储介质
CN111860299B (zh) * 2020-07-17 2023-09-08 北京奇艺世纪科技有限公司 目标对象的等级确定方法、装置、电子设备及存储介质
CN112419050B (zh) * 2020-12-24 2022-05-24 浙江工商大学 基于电话通讯网络和社交行为的信用评估方法及装置
CN112749980B (zh) * 2021-01-13 2021-12-07 深圳市恒鑫科技服务有限公司 一种基于区块链的信用资产处理方法及系统
CN112862593B (zh) * 2021-01-28 2024-05-03 深圳前海微众银行股份有限公司 信用评分卡模型训练方法、装置、系统及计算机存储介质
CN112906772A (zh) * 2021-02-04 2021-06-04 深圳前海微众银行股份有限公司 样本处理方法、装置、设备及计算机可读存储介质
CN113011966A (zh) * 2021-03-18 2021-06-22 中国光大银行股份有限公司 基于深度学习的信用评分方法及装置
CN113159924A (zh) * 2021-04-30 2021-07-23 中国银行股份有限公司 授信客户对象的确定方法及装置
CN113435764B (zh) * 2021-07-05 2023-01-31 深圳前海微众银行股份有限公司 风险因素追踪方法、装置、设备及计算机可读存储介质
KR102368010B1 (ko) * 2021-07-20 2022-02-25 리포츠 주식회사 운동 생활정보에 기초한 인공지능 기반의 대안적 신용평가정보 제공 방법 및 시스템
KR20240066782A (ko) 2022-11-08 2024-05-16 디티에쓰아이 주식회사 빅데이터와 기계학습을 이용한 대출 연체 정보 예측 시스템 및 그 방법
CN116205376B (zh) * 2023-04-27 2023-10-17 北京阿帕科蓝科技有限公司 行为预测方法、行为预测模型的训练方法和装置
CN117541318B (zh) * 2024-01-09 2024-04-02 前海超级前台(深圳)信息技术有限公司 一种离线消费智能评估监管方法、系统和介质
CN117808578A (zh) * 2024-03-01 2024-04-02 杭银消费金融股份有限公司 一种智能化人行征信数据解析方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1598831A (zh) * 2004-08-06 2005-03-23 武燕华 个人信用数据管理系统及方法
CN101937541A (zh) * 2009-06-30 2011-01-05 商文彬 一种用于评价客户信用度的方法及设备
CN102346901A (zh) * 2011-11-22 2012-02-08 北京信城通数码科技有限公司 一种互联网药品交易主体信用评估系统及其方法
CN104520886A (zh) * 2012-03-31 2015-04-15 环联公司 用于基于离线、在线及信用相关数据的目标因特网营销的系统及方法
CN104636447A (zh) * 2015-01-21 2015-05-20 上海天呈医流科技股份有限公司 一种面向医疗器械b2b网站用户的智能评价方法和系统
CN104866969A (zh) * 2015-05-25 2015-08-26 百度在线网络技术(北京)有限公司 个人信用数据处理方法和装置
CN105069683A (zh) * 2015-07-24 2015-11-18 广州时韵信息科技有限公司 一种纳税风险评估系统
CN105447752A (zh) * 2015-12-08 2016-03-30 安徽融信金模信息技术有限公司 一种基于信息共用的企业信用评估系统
CN105512815A (zh) * 2015-11-30 2016-04-20 安徽融信金模信息技术有限公司 一种用于企业风险评估的系统

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6088686A (en) * 1995-12-12 2000-07-11 Citibank, N.A. System and method to performing on-line credit reviews and approvals
JP2001229264A (ja) * 2000-02-18 2001-08-24 Dainippon Printing Co Ltd スマートカードによる与信・認証ビジネスシステムとそれに使用するスマートカード
US20040030667A1 (en) * 2002-08-02 2004-02-12 Capital One Financial Corporation Automated systems and methods for generating statistical models
US8036979B1 (en) * 2006-10-05 2011-10-11 Experian Information Solutions, Inc. System and method for generating a finance attribute from tradeline data
US20090327120A1 (en) * 2008-06-27 2009-12-31 Eze Ike O Tagged Credit Profile System for Credit Applicants
CN101996381A (zh) * 2009-08-14 2011-03-30 中国工商银行股份有限公司 一种零售资产风险的计算方法及系统
KR101253676B1 (ko) * 2011-04-08 2013-04-11 나이스신용평가정보주식회사 대출 진단 시뮬레이션 서비스 시스템 및 방법
KR20130008130A (ko) * 2011-07-11 2013-01-22 최원국 스마트 기기의 푸시 알림 기능을 이용한 대출 중개 서비스 제공 방법
US20140074688A1 (en) * 2012-09-13 2014-03-13 Rawllin International Inc. Behavioral based score
JP2014071532A (ja) * 2012-09-27 2014-04-21 Mycredit Kk 個人信用情報提供装置
TWM488068U (zh) * 2013-12-13 2014-10-11 Global Opto Technology Corp 借貸媒合平臺系統
KR101524971B1 (ko) * 2014-02-11 2015-06-02 숭실대학교산학협력단 개인 성향 예측 방법 및 그 장치
JP5852218B1 (ja) * 2014-12-19 2016-02-03 ヤフー株式会社 生成装置、生成方法及び生成プログラム
US10387939B2 (en) * 2015-08-21 2019-08-20 Q2 Software, Inc. Method, medium, and system for surfacing recommendations
CN105260471B (zh) * 2015-10-19 2019-03-26 广州品唯软件有限公司 商品个性化排序模型训练方法及系统
CN106097043B (zh) * 2016-06-01 2018-03-20 腾讯科技(深圳)有限公司 一种信用数据的处理方法及服务器
CN106127363B (zh) * 2016-06-12 2022-04-15 腾讯科技(深圳)有限公司 一种用户信用评估方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1598831A (zh) * 2004-08-06 2005-03-23 武燕华 个人信用数据管理系统及方法
CN101937541A (zh) * 2009-06-30 2011-01-05 商文彬 一种用于评价客户信用度的方法及设备
CN102346901A (zh) * 2011-11-22 2012-02-08 北京信城通数码科技有限公司 一种互联网药品交易主体信用评估系统及其方法
CN104520886A (zh) * 2012-03-31 2015-04-15 环联公司 用于基于离线、在线及信用相关数据的目标因特网营销的系统及方法
CN104636447A (zh) * 2015-01-21 2015-05-20 上海天呈医流科技股份有限公司 一种面向医疗器械b2b网站用户的智能评价方法和系统
CN104866969A (zh) * 2015-05-25 2015-08-26 百度在线网络技术(北京)有限公司 个人信用数据处理方法和装置
CN105069683A (zh) * 2015-07-24 2015-11-18 广州时韵信息科技有限公司 一种纳税风险评估系统
CN105512815A (zh) * 2015-11-30 2016-04-20 安徽融信金模信息技术有限公司 一种用于企业风险评估的系统
CN105447752A (zh) * 2015-12-08 2016-03-30 安徽融信金模信息技术有限公司 一种基于信息共用的企业信用评估系统

Also Published As

Publication number Publication date
US20180232805A1 (en) 2018-08-16
JP6732034B2 (ja) 2020-07-29
EP3471046A1 (en) 2019-04-17
EP3471046A4 (en) 2019-04-17
JP2019509556A (ja) 2019-04-04
KR20180119674A (ko) 2018-11-02
CN106127363A (zh) 2016-11-16
KR102178633B1 (ko) 2020-11-13
WO2017215403A1 (zh) 2017-12-21

Similar Documents

Publication Publication Date Title
CN106127363B (zh) 一种用户信用评估方法和装置
CN109165840B (zh) 风险预测处理方法、装置、计算机设备和介质
CN109272396B (zh) 客户风险预警方法、装置、计算机设备和介质
CN109543925B (zh) 基于机器学习的风险预测方法、装置、计算机设备和存储介质
US20190180379A1 (en) Life insurance system with fully automated underwriting process for real-time underwriting and risk adjustment, and corresponding method thereof
KR102009309B1 (ko) 금융상품 관리자동화 시스템 및 관리자동화 방법
US20140067461A1 (en) System and Method for Predicting Customer Attrition Using Dynamic User Interaction Data
CN110415036B (zh) 用户等级的确定方法、装置、计算机设备和存储介质
CA2935281C (en) A multidimensional recursive learning process and system used to discover complex dyadic or multiple counterparty relationships
CN114048436A (zh) 一种预测企业财务数据模型构建方法及构建装置
CA3053894A1 (en) Defect prediction using historical inspection data
CN117196322B (zh) 智能风控方法、装置、计算机设备及存储介质
CN113836241A (zh) 时序数据分类预测方法、装置、终端设备及存储介质
CN114493686A (zh) 一种运营内容生成推送方法及装置
CN113919432A (zh) 一种分类模型构建方法、数据分类方法及装置
CN117540336A (zh) 时间序列预测方法、装置及电子设备
CN112734566A (zh) 授信额度获取方法、装置及计算机设备
CN112581250B (zh) 模型生成方法、装置、计算机设备和存储介质
CN113065742A (zh) 小微企业的信用评价方法、系统、存储介质及电子设备
Luby Strengthening analyses of line-up procedures: a log-linear model framework
US20240127214A1 (en) Systems and methods for improving machine learning models
CN117522562A (zh) 一种基于核密度估计的信贷规模预测模型
CN112308706A (zh) 一种机器学习模型训练方法及装置
CN117726434A (zh) 一种信用评分卡模型训练方法、应用方法及相关产品
CN116797343A (zh) 风险评估方法、模型训练方法、装置、介质及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant