CN106127363B

CN106127363B - 一种用户信用评估方法和装置

Info

Publication number: CN106127363B
Application number: CN201610416661.1A
Authority: CN
Inventors: 陈培炫; 陈谦; 陈玲
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2016-06-12
Filing date: 2016-06-12
Publication date: 2022-04-15
Anticipated expiration: 2036-06-12
Also published as: US20180232805A1; JP6732034B2; EP3471046A1; EP3471046A4; JP2019509556A; KR20180119674A; CN106127363A; KR102178633B1; WO2017215403A1

Abstract

本发明实施例公开了一种用户信用评估方法和装置，其中的所述方法包括：获取目标用户的离线特征信息，所述离线特征信息为按照预设更新周期进行更新的用户的特征信息；根据目标用户的离线特征信息以及预设的离线预测模型，计算目标用户的离线信用评分；获取目标用户的实时特征信息，所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息，所述预设时间范围小于所述预设更新周期；根据目标用户的实时特征信息以及预设的实时预测模型，计算目标用户的实时信用评分；根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型，计算目标用户的综合信用评分。采用本发明，可提高用户信用的评估准确性。

Description

一种用户信用评估方法和装置

技术领域

本发明涉及互联网技术领域，尤其涉及一种用户信用评估方法和装置。

背景技术

近年来，随着互联网技术的飞速发展，人们越来越多的通过互联网进行各种数据业务，而用户的信用评估也成为了一个互联网技术领域的焦点问题。

现有技术中对用户的信用评估方式通常是通过收集用户的个人信息，然后通过统计模型或机器学习的一些预测算法，对用户违约风险进行预测，例如常用的FICO信用评分系统以及Zestfinace信用评价系统。现有的信用评分机制中采用的个人信息(大数据)通常都是按照预设更新周期进行更新，更新周期一般为一个月或更长，用户发生的状况要在下次更新时才能被参考，照成信息滞后，对用户信用的评估准确性带来非常大的影响。

发明内容

本发明实施例所要解决的技术问题在于，提供一种用户信用评估方法和装置，可避免信息更新周期带来的用户信息滞后，提高用户信用的评估准确性。

为了解决上述技术问题，本发明实施例提供了一种用户信用评估方法，所述方法包括：

获取目标用户的离线特征信息，所述离线特征信息为按照预设更新周期进行更新的用户的特征信息；

根据目标用户的离线特征信息以及预设的离线预测模型，计算目标用户的离线信用评分；

获取目标用户的实时特征信息，所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息，所述预设时间范围小于所述预设更新周期；

根据目标用户的实时特征信息以及预设的实时预测模型，计算目标用户的实时信用评分；

根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型，计算目标用户的综合信用评分。

相应地，本发明实施例还提供了一种用户信用评估装置，所述装置包括：

离线特征获取模块，用于获取目标用户的离线特征信息，所述离线特征信息为按照预设更新周期进行更新的用户的特征信息；

离线评分模块，用于根据目标用户的离线特征信息以及预设的离线预测模型，计算目标用户的离线信用评分；

实时特征获取模块，用于获取目标用户的实时特征信息，所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息，所述预设时间范围小于所述预设更新周期；

实时评分模块，用于根据目标用户的实时特征信息以及预设的实时预测模型，计算目标用户的实时信用评分；

综合评分模块，用于根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型，计算目标用户的综合信用评分。

本发明实施例中的用户信用评估装置通过获取用户的离线特征信息和实时特征信息，分别计算用户的离线信用评分和实时信用评分，从而计算用户的综合信用评分，实现了结合用户的长期特征数据和实时特征数据准确预测用户的信用状况，解决了现有技术中因此用户信息滞后造成的信用估计不准确的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例中的一种用户信用评估方法的流程示意图；

图2是本发明实施例中获取用户的实时特征信息和离线特征信息的来源示意图；

图3是本发明实施例中对离线预测模型进行训练的流程示意图；

图4是本发明实施例中对实时预测模型进行训练的流程示意图；

图5是本发明实施例中对综合预测模型进行训练的流程示意图；

图6是本发明实施例中的一种用户信用评估装置的结构示意图；

图7是本发明实施例中的样本获取模块的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例中的用户信用评估方法和装置，可以实现在如个人电脑、笔记本电脑、智能手机、平板电脑、电子阅读器等计算机系统中，较多的可以被采用在提供用户信用评估的服务器中，例如数据业务平台的后台服务器。下文均以用户信用评估装置作为本发明实施例的执行主体进行介绍。

图1是本发明实施例中的一种用户信用评估方法的流程示意图，如图所示本实施例中的用户信用评估方法流程可以包括：

S101，获取目标用户的离线特征信息，所述离线特征信息为按照预设更新周期进行更新的用户的特征信息。

所述离线特征信息如图2所示，用户信用评估装置可以通过采集来自第三方提供的用户数据得到，也可以通过业务平台采集得到的用户数据中获取得到。用户信用评估装置可以通过对上述得到的用户数据进行特征计算，将用户数据中的用户属性、用户行为或用户属性/行为的变化转换为统一格式的离线特征信息，例如数字化的特征信息。所述预设的更新周期，可以是外部厂商提供用户数据的更新周期，也可以是用户信用评估装置中自身设置的采集更新周期。由于大数据涉及庞大的用户基数，离线特征信息中可以包括用户所有的历史特征信息，数据量庞大，因此该预设的更新周期一般较长，通常至少为一周至一个月。在可选实施例中，所述离线特征信息可以为用户较为稳定的特征信息，例如性别、年龄、籍贯、职业、收入情况等属性，还可以包括所有的历史契约信用记录，对于此类通常较为稳定的用户特征信息，只需要按照预设更新周期进行更新即可，因此将这些特征类别的信息作为离线特征信息。

在可选实施例中，所述离线特征信息可以是经过筛选的特征类别的离线特征信息，即第三方提供的用户数据或业务平台采集得到的用户数据中可能包括多个特征类别的离线特征信息，用户信用评估装置可以从中筛选出指定特征类别的离线特征信息。所述指定的特征类别，可以是用户信用评估装置根据预设的训练样本数据，所述训练样本数据包括多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本，用户信用评估装置根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本，计算各个特征类别与信用评分结果之间的相关度，从而将与信用评分结果之间的相关度达到预设阈值的特征类别确定为指定的特征类别。

S102，根据目标用户的离线特征信息以及预设的离线预测模型，计算目标用户的离线信用评分。

所述离线预测模型，可以是经过训练的逻辑回归分类模型，也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。用户信用评估装置将目标用户的离线特征信息代入到所述预设的离线预测模型中，即可计算得到目标用户的离线信用评分。

所述离线预测模型可以是用户信用评估装置根据预设的训练样本数据训练得到的，所述训练样本数据可以包括多个用户的信用评分结果样本和各个用户的离线特征信息；所述离线预测模型还可以是用户信用评估装置从外部获取的经过训练的离线预测模型。

S103，获取目标用户的实时特征信息，所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息，所述预设时间范围小于所述预设更新周期。

所述实时特征信息如图2所示，用户信用评估装置可以通过业务平台采集得到的用户数据中获取得到。用户信用评估装置可以通过对得到的用户数据进行特征计算，将用户数据中的用户属性、用户行为或用户属性/行为的变化转换为统一格式的实时特征信息，例如数字化的特征信息。所述业务平台可以采集用户最新的特征信息，所述预设时间范围小于所述预设更新周期，例如最近一天、两天或一周内采集到的用户的特征信息。在可选实施例中，用户信用评估装置可以预先设定一些特征类别作为高风险特征，当用户这些高风险特征对应的特征信息发生变化时，将会对用户的信用评分带来很大的影响，例如用户办理了特定平台借贷业务、办理出国签证业务、所在地理位置发生变化或发生了特定领域的大额消费等，对于这些需要实时关注的高风险特征，用户信用评估装置可以将对应的特征信息作为用户的实时特征信息进行实时收集并录入，对于其他的特征信息作为离线特征信息进行预设更新周期的更新。

同样的，所述实时特征信息可以是经过筛选的特征类别的实时特征信息，即第三方提供的用户数据或业务平台采集得到的用户数据中可能包括多个特征类别的实时特征信息，用户信用评估装置可以从中筛选出指定特征类别的实时特征信息。所述指定的特征类别，可以是用户信用评估装置根据预设的训练样本数据，所述训练样本数据包括多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本，用户信用评估装置根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本，计算各个特征类别与信用评分结果之间的相关度，从而将与信用评分结果之间的相关度达到预设阈值的特征类别确定为指定的特征类别。

S104，根据目标用户的实时特征信息以及预设的实时预测模型，计算目标用户的实时信用评分。

所述实时预测模型，可以是经过训练的逻辑回归分类模型，也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。用户信用评估装置将目标用户的实时特征信息代入到所述预设的实时预测模型中，即可计算得到目标用户的实时信用评分。

所述实时预测模型可以是用户信用评估装置根据预设的训练样本数据训练得到的，所述训练样本数据可以包括多个用户的信用评分结果样本和各个用户的离线特征信息；所述实时预测模型还可以是用户信用评估装置从外部获取的经过训练的实时预测模型。

S105，根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型，计算目标用户的综合信用评分。

所述综合预测模型，可以是经过训练的逻辑回归分类模型，也可以是经过训练的集成学习模型、深度学习模型、随机森林模型、梯度提升决策树模型等。用户信用评估装置将目标用户的离线信用评分和实时信用评分代入到所述预设的实时预测模型中，即可计算得到目标用户的实时信用评分。

所述综合预测模型可以是用户信用评估装置根据预设的训练样本数据训练得到的，所述训练样本数据可以包括多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息，用户信用评估装置在使用离线预测模型根据用户的离线特征信息得到各个用户的离线信用评分，以及使用实时预测模型根据用户的实时特征信息得到各个用户的实时信用评分后，根据所述多个用户的信用评分结果以及各个用户的离线信用评分和实时信用评分对所述综合预测模型进行训练。所述实时预测模型还可以是用户信用评估装置从外部获取的经过训练的实时预测模型。

示例性的，可以采用下式逻辑回归算法的综合预测模型计算得到目标用户的实时信用评分：

Score＝1/(1+exp(-(α*Score1+β*Score2+γ)))

其中α，β，γ为训练模型得到的参数，Score1和Score2分别为目标用户的离线信用评分和实时信用评分，结果Score为目标用户的综合信用评分。

进而在可选实施例中，用户信用评估装置可以根据经过本实施例上述步骤后计算得到的目标用户的综合信用评分为目标用户推送产品信息，例如推送金融产品信息、固定资产管理产品信息等；或根据目标用户的综合信用评分对目标用户的数据业务进行监控管理，例如对目标用户的借贷业务进行风控管理、对目标用户的流动资金进行管理建议等。

从而，本发明实施例中的用户信用评估装置通过获取用户的离线特征信息和实时特征信息，分别计算用户的离线信用评分和实时信用评分，从而计算用户的综合信用评分，实现了结合用户的长期特征数据和实时特征数据准确预测用户的信用状况，解决了现有技术中因此用户信息滞后造成的信用估计不准确的问题。

图3是本发明实施例中对离线预测模型进行训练的流程示意图，如图所示本实施例中的离线预测模型训练流程可以包括：

S301，获取多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本。

可选的，所述多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本可以根据输入至用户信用评估装置的训练样本数据中提取得到。

或者，所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到，即根据该多个用户是否违约，或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中，所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后，用户信用评估装置可以通过采集来自第三方提供的用户数据，或可以通过业务平台采集得到的用户数据中获取得到各个用户的多个特征类别的离线特征信息样本。

S302，根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本，计算各个特征类别与信用评分结果之间的相关度。

所述特征类别可以例如年龄、所在地、性别、职业等，特征类别与信用评分结果之间的相关度，反应的是如年龄、性别、职业等对于用户信用评分结果的影响，如果相关度较高，则表示该特征类别对于信用评分结果影响较大，反之则是对信用评分结果影响很小，可以在建立离线预测模型时，不考虑该特征类别的离线特征信息。

具体的，所述各个特征类别与信用评分结果之间的相关度，示例性地可以采用下式计算相关度r：

其中x为某个特征类别的离线特征信息，y为用户的信用评分结果.下标i则表示对应不同的用户。

在其他可选实施例中，还可以采用IV值、卡方值等相关度算法计算所述各个特征类别与信用评分结果之间的相关度。

S303，将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述离线特征信息的特征类别，并从所述各个用户的多个特征类别的离线特征信息样本中筛选出对应特征类别的离线特征信息。

在计算得到各个特征类别与信用评分结果之间的相关度后，可以与相应的预设阈值进行比较后，将相关度达到要求的特征类别确定所述离线特征信息的特征类别，并从所述各个用户的多个特征类别的离线特征信息样本中筛选出对应特征类别的离线特征信息。

S304，根据经过筛选的对应特征类别的用户的离线特征信息建立离线预测模型，并根据所述多个用户的信用评分结果样本和各个用户的对应特征类别的离线特征信息对离线预测模型进行训练

所述离线预测模型，可以是经过训练的逻辑回归分类模型，也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。所述离线预测模型可以是用户信用评估装置根据经过筛选的对应特征类别的用户的离线特征信息结合特定的模型参数计算用户的信用评分的一个预测算式，通过所述多个用户的信用评分结果样本和各个用户的对应特征类别的离线特征信息对该预测算式中的模型参数进行训练迭代，从而可以得到最接近信用评分结果样本的预测算式的模型参数，从而得到经过训练的离线预测模型。

需要指出的是，上述S302和S303为可选步骤，在可选实施例中可以不经筛选的将获取到的各个用户的多个特征类别的离线特征信息样本都作为离线特征信息进行实时预测模型的训练。

图4是本发明实施例中对实时预测模型进行训练的流程示意图，如图所示本实施例中的实时预测模型训练流程可以包括：

S401，获取多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本。

可选的，所述多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本可以根据输入至用户信用评估装置的训练样本数据中提取得到。

或者，所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到，即根据该多个用户是否违约，或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中，所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后，用户信用评估装置可以获取业务平台采集得到的用户数据中获取得到各个用户的多个特征类别的实时特征信息样本。

S402，根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本，计算各个特征类别与信用评分结果之间的相关度。

所述特征类别可以例如年龄、所在地、性别、职业等，特征类别与信用评分结果之间的相关度，反应的是如年龄、性别、职业等对于用户信用评分结果的影响，如果相关度较高，则表示该特征类别对于信用评分结果影响较大，反之则是对信用评分结果影响很小，可以在建立实时预测模型时，不考虑该特征类别的实时特征信息。

具体的，所述各个特征类别与信用评分结果之间的相关度，示例性地可以采用下式计算相关度s：

其中z为某个特征类别的实时特征信息，y为用户的信用评分结果.下标i则表示对应不同的用户。

在其他可选实施例中，还可以采用IV值、卡方值等相关度算法计算所述各个特征类别的实时特征信息与信用评分结果之间的相关度。

S403，将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述实时特征信息的特征类别，并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。

在计算得到各个特征类别与信用评分结果之间的相关度后，可以与相应的预设阈值进行比较后，将相关度达到要求的特征类别确定所述实时特征信息的特征类别，并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。

S404，根据经过筛选的对应特征类别的用户的实时特征信息建立实时预测模型，并根据所述多个用户的信用评分结果样本和各个用户的对应特征类别的实时特征信息对实时预测模型进行训练

所述实时预测模型，可以是经过训练的逻辑回归分类模型，也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。所述实时预测模型可以是用户信用评估装置根据经过筛选的对应特征类别的用户的实时特征信息结合特定的模型参数计算用户的信用评分的一个预测算式，通过所述多个用户的信用评分结果样本和各个用户的对应特征类别的实时特征信息对该预测算式中的模型参数进行训练迭代，从而可以得到最接近信用评分结果样本的预测算式的模型参数，从而得到经过训练的实时预测模型。

需要指出的是，上述S402和S403为可选步骤，在可选实施例中可以不经筛选的将获取到的各个用户的多个特征类别的实时特征信息样本都作为实时特征信息进行实时预测模型的训练。

图5是本发明实施例中对综合预测模型进行训练的流程示意图。

S501，获取多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息。

可选的，所述多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息可以根据输入至用户信用评估装置的训练样本数据中提取得到。

或者，所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到，即根据该多个用户是否违约，或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中，所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后，用户信用评估装置可以通过采集来自第三方提供的用户数据，或可以通过业务平台采集得到的用户数据中获取得到各个用户的多个特征类别的实时特征信息样本。

S502，根据所述各个用户的离线特征信息以及预设的离线预测模型，计算所述各个用户的离线信用评分。

S503，根据所述各个用户的实时特征信息以及预设的实时预测模型，计算所述各个用户的实时信用评分。

S504，根据用户的离线信用评分和实时信用评分建立所述综合预测模型，并根据所述多个用户的信用评分结果以及各个用户的离线信用评分和实时信用评分对所述综合预测模型进行训练。

所述综合预测模型，可以是经过训练的逻辑回归分类模型，也可以是经过训练的集成学习模型、深度学习模型、随机森林模型、梯度提升决策树模型等。所述综合预测模型可以是用户信用评估装置根据用户的离线信用评分和实时信用评分结合特定的模型参数计算用户的综合信用评分的一个预测算式，通过所述多个用户的信用评分结果样本和计算得到的各个用户的离线信用评分和实时信用评分可以对该预测算式中的模型参数进行训练迭代，从而可以得到最接近信用评分结果样本的预测算式的模型参数，从而得到经过训练的综合预测模型。

Score＝1/(1+exp(-(α*Score1+β*Score2+γ)))

图6是本发明一种用户信用评估装置的结构示意图，如图所示本发明实施例中的用户信用评估装置可以包括：

离线特征获取模块610，用于获取目标用户的离线特征信息，所述离线特征信息为按照预设更新周期进行更新的用户的特征信息。

所述离线特征信息如图2所示，离线特征获取模块610可以通过采集来自第三方提供的用户数据得到，也可以通过业务平台采集得到的用户数据中获取得到。离线特征获取模块610可以通过对上述得到的用户数据进行特征计算，将用户数据中的用户属性、用户行为或用户属性/行为的变化转换为统一格式的离线特征信息，例如数字化的特征信息。所述预设的更新周期，可以是外部厂商提供用户数据的更新周期，也可以是离线特征获取模块610中自身设置的采集更新周期。由于大数据涉及庞大的用户基数，离线特征信息中可以包括用户所有的历史特征信息，数据量庞大，因此该预设的更新周期一般较长，通常至少为一周至一个月。在可选实施例中，所述离线特征信息可以为用户较为稳定的特征信息，例如性别、年龄、籍贯、职业、收入情况等属性，还可以包括所有的历史契约信用记录，对于此类通常较为稳定的用户特征信息，只需要按照预设更新周期进行更新即可，因此将这些特征类别的信息作为离线特征信息。

在可选实施例中，所述离线特征信息可以是经过筛选的特征类别的离线特征信息，即第三方提供的用户数据或业务平台采集得到的用户数据中可能包括多个特征类别的离线特征信息，离线特征获取模块610可以从中筛选出指定特征类别的离线特征信息。所述指定的特征类别，可以是用户信用评估装置根据预设的训练样本数据，所述训练样本数据包括多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本，用户信用评估装置根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本，计算各个特征类别与信用评分结果之间的相关度，从而将与信用评分结果之间的相关度达到预设阈值的特征类别确定为指定的特征类别。

离线评分模块620，用于根据目标用户的离线特征信息以及预设的离线预测模型，计算目标用户的离线信用评分。

所述离线预测模型，可以是经过训练的逻辑回归分类模型，也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。离线评分模块620将目标用户的离线特征信息代入到所述预设的离线预测模型中，即可计算得到目标用户的离线信用评分。

实时特征获取模块630，用于获取目标用户的实时特征信息，所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息，所述预设时间范围小于所述预设更新周期。

所述实时特征信息如图2所示，实时特征获取模块630可以通过业务平台采集得到的用户数据中获取得到。实时特征获取模块630可以通过对得到的用户数据进行特征计算，将用户数据中的用户属性、用户行为或用户属性/行为的变化转换为统一格式的实时特征信息，例如数字化的特征信息。所述业务平台可以采集用户最新的特征信息，所述预设时间范围小于所述预设更新周期，例如最近一天、两天或一周内采集到的用户的特征信息。在可选实施例中，用户信用评估装置可以预先设定一些特征类别作为高风险特征，当用户这些高风险特征对应的特征信息发生变化时，将会对用户的信用评分带来很大的影响，例如用户办理了特定平台借贷业务、办理出国签证业务、所在地理位置发生变化或发生了特定领域的大额消费等，对于这些需要实时关注的高风险特征，实时特征获取模块630可以将对应的特征信息作为用户的实时特征信息进行实时收集并录入，对于其他的特征信息作为离线特征信息进行预设更新周期的更新。

同样的，所述实时特征信息可以是经过筛选的特征类别的实时特征信息，即第三方提供的用户数据或业务平台采集得到的用户数据中可能包括多个特征类别的实时特征信息，实时特征获取模块630可以从中筛选出指定特征类别的实时特征信息。所述指定的特征类别，可以是用户信用评估装置根据预设的训练样本数据，所述训练样本数据包括多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本，用户信用评估装置根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本，计算各个特征类别与信用评分结果之间的相关度，从而将与信用评分结果之间的相关度达到预设阈值的特征类别确定为指定的特征类别。

实时评分模块640，用于根据目标用户的实时特征信息以及预设的实时预测模型，计算目标用户的实时信用评分。

综合评分模块650，用于根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型，计算目标用户的综合信用评分。

所述综合预测模型，可以是经过训练的逻辑回归分类模型，也可以是经过训练的集成学习模型、深度学习模型、随机森林模型、梯度提升决策树模型等。综合评分模块650将目标用户的离线信用评分和实时信用评分代入到所述预设的实时预测模型中，即可计算得到目标用户的实时信用评分。

Score＝1/(1+exp(-(α*Score1+β*Score2+γ)))

在可选实施例中，所述用户信用评估装置还可以包括：

样本获取模块660，用于获取多个用户的信用评分结果样本和各个用户的离线特征信息。

可选的，所述多个用户的信用评分结果样本和各个用户的离线特征信息可以根据输入至用户信用评估装置的训练样本数据中提取得到。

或者，所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到，即根据该多个用户是否违约，或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中，所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后，样本获取模块660可以通过采集来自第三方提供的用户数据，或可以通过业务平台采集得到的用户数据中获取得到各个用户的离线特征信息。

离线模型训练模块670，用于根据用户的离线特征信息建立所述离线预测模型，并根据所述多个用户的信用评分结果样本和各个用户的离线特征信息对所述离线预测模型进行训练。

所述离线预测模型，可以是经过训练的逻辑回归分类模型，也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。所述离线预测模型可以是根据经过筛选的对应特征类别的用户的离线特征信息结合特定的模型参数计算用户的信用评分的一个预测算式，离线模型训练模块670通过所述多个用户的信用评分结果样本和各个用户的对应特征类别的离线特征信息对该预测算式中的模型参数进行训练迭代，从而可以得到最接近信用评分结果样本的预测算式的模型参数，从而得到经过训练的离线预测模型。

进而可选的，所述样本获取模块660如图7所示进一步可以包括：

离线样本获取单元661，用于获取多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本；

相关度计算单元663，用于根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本，计算各个特征类别与信用评分结果之间的相关度；

特征类别筛选单元665，用于将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述离线特征信息的特征类别，并从所述各个用户的多个特征类别的离线特征信息样本中筛选出对应特征类别的离线特征信息。

在可选实施例中，所述样本获取模块660，用于获取多个用户的信用评分结果样本和各个用户的实时特征信息；

可选的，所述多个用户的信用评分结果样本和各个用户的实时特征信息可以根据输入至用户信用评估装置的训练样本数据中提取得到。

或者，所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到，即根据该多个用户是否违约，或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中，所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后，用户信用评估装置可以获取业务平台采集得到的用户数据中获取得到各个用户的实时特征信息。

所述用户信用评估装置还可以包括：

实时模型训练模块680，用于根据用户的实时特征信息建立所述实时预测模型，并根据所述多个用户的信用评分结果样本和各个用户的实时特征信息对所述实时预测模型进行训练。

所述实时预测模型，可以是经过训练的逻辑回归分类模型，也可以是经过训练的集成学习模型、深度学习模型、随机森林模型等。所述实时预测模型可以是用户信用评估装置根据经过筛选的对应特征类别的用户的实时特征信息结合特定的模型参数计算用户的信用评分的一个预测算式，实时模型训练模块680通过所述多个用户的信用评分结果样本和各个用户的对应特征类别的实时特征信息对该预测算式中的模型参数进行训练迭代，从而可以得到最接近信用评分结果样本的预测算式的模型参数，从而得到经过训练的实时预测模型。

进而可选的，所述样本获取模块如图7所示进一步可以包括：

实时样本获取单元662，用于获取多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本。

相关度计算单元663，用于根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本，计算各个特征类别与信用评分结果之间的相关度。

特征类别筛选单元665，用于将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述实时特征信息的特征类别，并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。

在计算得到各个特征类别与信用评分结果之间的相关度后，特征类别筛选单元665可以与相应的预设阈值进行比较后，将相关度达到要求的特征类别确定所述实时特征信息的特征类别，并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。

在可选实施例中，所述样本获取模块660，用于获取多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息。

或者，所述多个用户的信用评分结果样本可以通过对该多个用户的违约记录计算得到，即根据该多个用户是否违约，或违约事件的次数和严重程度等确定多个用户的信用评分结果样本。而在可选实施例中，所述多个用户的信用评分结果样本也可以采用人工评分的方式得到。进而在得到上述多个用户的评分结果样本后，所述样本获取模块660可以通过采集来自第三方提供的用户数据，或可以通过业务平台采集得到的用户数据中获取得到各个用户的多个特征类别的实时特征信息样本。

所述离线评分模块620，还用于根据所述各个用户的离线特征信息以及预设的离线预测模型，计算所述各个用户的离线信用评分；

所述实时评分模块640，还用于根据所述各个用户的实时特征信息以及预设的实时预测模型，计算所述各个用户的实时信用评分；

所述用户信用评估装置还可以包括：

综合模型训练模块690，用于根据用户的离线信用评分和实时信用评分建立所述综合预测模型，并根据所述多个用户的信用评分结果以及各个用户的离线信用评分和实时信用评分对所述综合预测模型进行训练。

Score＝1/(1+exp(-(α*Score1+β*Score2+γ)))

进而在可选实施例中，所述用户信用评估装置还可以包括信息推送模块6100或业务监控模块6110，其中：

信息推送模块6100，用于根据目标用户的综合信用评分为目标用户推送产品信息，即根据经过本发明实施例的综合评分模块650计算得到的目标用户的综合信用评分为目标用户推送产品信息，例如推送金融产品信息、固定资产管理产品信息等。

业务监控模块6110，用于根据目标用户的综合信用评分对目标用户的数据业务进行监控管理，例如对目标用户的借贷业务进行风控管理、对目标用户的流动资金进行管理建议等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种用户的综合信用评分的应用方法，其特征在于，应用于提供用户信用评估的服务器中，所述方法包括：

获取目标用户的离线特征信息，所述离线特征信息为按照预设更新周期进行更新的用户的特征信息，所述离线特征信息是指对用户的信用评分产生影响的第一类风险特征，包括以下至少一种：年龄、性别、籍贯、收入、职业、历史契约信用记录；所述第一类风险特征具有稳定性；

根据目标用户的离线特征信息以及预设的离线预测模型，计算目标用户的离线信用评分，所述离线信用评分是利用所述离线预测模型对所述离线特征信息进行计算得到的，所述离线信用评分用于表示目标用户签订契约后的违约风险；

获取目标用户的实时特征信息，所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息，所述预设时间范围小于所述预设更新周期，所述实时特征信息是指对用户的信用评分产生影响的第二类风险特征，包括以下至少一种：办理特定平台借贷业务、办理出国签证业务、所在地理位置发生变化、发生特定领域的大额消费；所述第二类风险特征具有突发性；

根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型，计算目标用户的综合信用评分；

根据目标用户的综合信用评分为目标用户推送产品信息，或根据目标用户的综合信用评分对目标用户的数据业务进行监控管理；

其中，所述获取目标用户的离线特征信息，包括：

从第三方平台和/或业务平台采集目标用户的离线用户数据；

通过对所述离线用户数据进行特征计算，将所述离线用户数据中的用户属性、用户行为或用户属性/行为的变化转换为统一格式的离线特征信息；

其中，所述离线预测模型是根据用户的离线特征信息结合特定的模型参数计算用户的信用评分的一个预测算式，所述离线预测模型是利用训练样本数据进行训练得到的，所述训练样本数据包括多个用户的信用评分结果样本和各个用户的离线特征信息；利用所述训练样本数据训练得到离线预测模型，包括：通过所述多个用户的信用评分结果样本和各个用户的离线特征信息对所述预测算式中的模型参数进行训练迭代，确定目标模型参数；根据所述目标模型参数确定经过训练的离线预测模型；其中，利用所述经过训练的离线预测模型对用户的离线特征信息进行计算得到的信用评分结果，与相应的信用评分结果样本之间的差值小于或等于目标数值。

2.如权利要求1所述的用户的综合信用评分的应用方法，其特征在于，所述获取目标用户的离线特征信息之前还包括：

获取多个用户的信用评分结果样本和各个用户的离线特征信息；

根据用户的离线特征信息建立所述离线预测模型，并根据所述多个用户的信用评分结果样本和各个用户的离线特征信息对所述离线预测模型进行训练。

3.如权利要求2所述的用户的综合信用评分的应用方法，其特征在于，所述获取多个用户的信用评分结果样本和各个用户的离线特征信息包括：

获取多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本；

根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本，计算各个特征类别与信用评分结果之间的相关度；

将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述离线特征信息的特征类别，并从所述各个用户的多个特征类别的离线特征信息样本中筛选出对应特征类别的离线特征信息。

4.如权利要求1所述的用户的综合信用评分的应用方法，其特征在于，所述获取用户的实时特征信息之前还包括：

获取多个用户的信用评分结果样本和各个用户的实时特征信息；

根据用户的实时特征信息建立所述实时预测模型，并根据所述多个用户的信用评分结果样本和各个用户的实时特征信息对所述实时预测模型进行训练。

5.如权利要求4所述的用户的综合信用评分的应用方法，其特征在于，所述获取多个用户的信用评分结果样本和各个用户的实时特征信息包括：

获取多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本；

根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本，计算各个特征类别与信用评分结果之间的相关度；

将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述实时特征信息的特征类别，并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。

6.如权利要求1所述的用户的综合信用评分的应用方法，其特征在于，所述根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型，计算目标用户的综合信用评分之前还包括：

获取多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息；

根据所述各个用户的离线特征信息以及预设的离线预测模型，计算所述各个用户的离线信用评分；

根据所述各个用户的实时特征信息以及预设的实时预测模型，计算所述各个用户的实时信用评分；

根据用户的离线信用评分和实时信用评分建立所述综合预测模型，并根据所述多个用户的信用评分结果以及各个用户的离线信用评分和实时信用评分对所述综合预测模型进行训练。

7.如权利要求1所述的用户的综合信用评分的应用方法，其特征在于，所述实时特征信息包括业务平台采集得到的用户数据；

所述离线特征信息包括第三方提供的用户数据或业务平台采集得到的用户数据。

8.如权利要求1-7中任一项所述的用户的综合信用评分的应用方法，其特征在于，所述根据目标用户的综合信用评分为目标用户推送产品信息包括推送金融产品信息或固定资产管理产品信息；或

所述根据目标用户的综合信用评分对目标用户的数据业务进行监控管理包括对目标用户的借贷业务进行风控管理或对目标用户的流动资金进行管理建议。

9.一种用户的综合信用评分的应用装置，其特征在于，应用于提供用户信用评估的服务器中，所述装置包括：

离线特征获取模块，用于获取目标用户的离线特征信息，所述离线特征信息为按照预设更新周期进行更新的用户的特征信息，所述离线特征信息是指对用户的信用评分产生影响的第一类风险特征，包括以下至少一种：年龄、性别、籍贯、收入、职业、历史契约信用记录；所述第一类风险特征具有稳定性；

离线评分模块，用于根据目标用户的离线特征信息以及预设的离线预测模型，计算目标用户的离线信用评分，所述离线信用评分是利用所述离线预测模型对所述离线特征信息进行计算得到的，所述离线信用评分用于表示目标用户签订契约后的违约风险；

实时特征获取模块，用于获取目标用户的实时特征信息，所述实时特征信息为距离当前预设时间范围内采集到的用户的特征信息，所述预设时间范围小于所述预设更新周期，所述实时特征信息是指对用户的信用评分产生影响的第二类风险特征，包括以下至少一种：办理特定平台借贷业务、办理出国签证业务、所在地理位置发生变化、发生特定领域的大额消费；所述第二类风险特征具有突发性；

综合评分模块，用于根据得到的目标用户的离线信用评分和实时信用评分结合预设的综合预测模型，计算目标用户的综合信用评分；

信息推送模块，用于根据目标用户的综合信用评分为目标用户推送产品信息；或业务监控模块，用于根据目标用户的综合信用评分对目标用户的数据业务进行监控管理；

其中，所述离线特征获取模块获取目标用户的离线特征信息时，具体用于：

从第三方平台和/或业务平台采集目标用户的离线用户数据；

其中，所述离线预测模型是根据用户的离线特征信息结合特定的模型参数计算用户的信用评分的一个预测算式，所述离线预测模型是利用训练样本数据进行训练得到的，所述训练样本数据包括多个用户的信用评分结果样本和各个用户的离线特征信息；所述装置还包括模型训练模块，具体用于：通过所述多个用户的信用评分结果样本和各个用户的离线特征信息对所述预测算式中的模型参数进行训练迭代，确定目标模型参数；根据所述目标模型参数确定经过训练的离线预测模型；其中，利用所述经过训练的离线预测模型对用户的离线特征信息进行计算得到的信用评分结果，与相应的信用评分结果样本之间的差值小于或等于目标数值。

10.如权利要求9所述的用户的综合信用评分的应用装置，其特征在于，还包括：

样本获取模块，用于获取多个用户的信用评分结果样本和各个用户的离线特征信息；

离线模型训练模块，用于根据用户的离线特征信息建立所述离线预测模型，并根据所述多个用户的信用评分结果样本和各个用户的离线特征信息对所述离线预测模型进行训练。

11.如权利要求10所述的用户的综合信用评分的应用装置，其特征在于，所述样本获取模块包括：

离线样本获取单元，用于获取多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本；

相关度计算单元，用于根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的离线特征信息样本，计算各个特征类别与信用评分结果之间的相关度；

特征类别筛选单元，用于将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述离线特征信息的特征类别，并从所述各个用户的多个特征类别的离线特征信息样本中筛选出对应特征类别的离线特征信息。

12.如权利要求9所述的用户的综合信用评分的应用装置，其特征在于，还包括：

样本获取模块，用于获取多个用户的信用评分结果样本和各个用户的实时特征信息；

实时模型训练模块，用于根据用户的实时特征信息建立所述实时预测模型，并根据所述多个用户的信用评分结果样本和各个用户的实时特征信息对所述实时预测模型进行训练。

13.如权利要求12所述的用户的综合信用评分的应用装置，其特征在于，所述样本获取模块包括：

实时样本获取单元，用于获取多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本；

相关度计算单元，用于根据所述用户信用样本数据中多个用户的信用评分结果样本和各个用户的多个特征类别的实时特征信息样本，计算各个特征类别与信用评分结果之间的相关度；

特征类别筛选单元，用于将与信用评分结果之间的相关度达到预设阈值的特征类别确定为所述实时特征信息的特征类别，并从所述各个用户的多个特征类别的实时特征信息样本中筛选出对应特征类别的实时特征信息。

14.如权利要求9所述的用户的综合信用评分的应用装置，其特征在于，还包括：

样本获取模块，获取多个用户的信用评分结果样本和各个用户的离线特征信息和实时特征信息；

所述离线评分模块，还用于根据所述各个用户的离线特征信息以及预设的离线预测模型，计算所述各个用户的离线信用评分；

所述实时评分模块，还用于根据所述各个用户的实时特征信息以及预设的实时预测模型，计算所述各个用户的实时信用评分；

综合模型训练模块，用于根据用户的离线信用评分和实时信用评分建立所述综合预测模型，并根据所述多个用户的信用评分结果以及各个用户的离线信用评分和实时信用评分对所述综合预测模型进行训练。

15.如权利要求9所述的用户的综合信用评分的应用装置，其特征在于，所述实时特征信息为业务平台采集得到的用户数据；

所述离线特征信息包括第三方提供的用户数据和业务平台采集得到的用户数据。

16.如权利要求9-15中任一项所述的用户的综合信用评分的应用装置，其特征在于，所述信息推送模块具体用于根据目标用户的综合信用评分为目标用户推送金融产品信息或固定资产管理产品信息；或

所述业务监控模块具体用于根据目标用户的综合信用评分对目标用户的借贷业务进行风控管理或对目标用户的流动资金进行管理建议。