CN112328869A - 一种用户贷款意愿的预测方法、装置及计算机系统 - Google Patents

一种用户贷款意愿的预测方法、装置及计算机系统 Download PDF

Info

Publication number
CN112328869A
CN112328869A CN202011043449.8A CN202011043449A CN112328869A CN 112328869 A CN112328869 A CN 112328869A CN 202011043449 A CN202011043449 A CN 202011043449A CN 112328869 A CN112328869 A CN 112328869A
Authority
CN
China
Prior art keywords
preset
user
prediction
model
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011043449.8A
Other languages
English (en)
Inventor
黎倩文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suning Financial Technology Nanjing Co Ltd
Original Assignee
Suning Financial Technology Nanjing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suning Financial Technology Nanjing Co Ltd filed Critical Suning Financial Technology Nanjing Co Ltd
Priority to CN202011043449.8A priority Critical patent/CN112328869A/zh
Publication of CN112328869A publication Critical patent/CN112328869A/zh
Priority to CA3135466A priority patent/CA3135466A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请公开了一种用户贷款意愿的预测方法、装置及计算机系统,所述方法包括:获取待预测用户的用户数据,所述用户数据包括所述待预测用户的用户属性及历史消费行为;使用第一预设模型的多个预设分类器,分别根据所述用户数据生成对所述用户所属分类的预测结果,所述预设分类器用于对用户进行分类;整合每一所述预设分类器的预测结果,生成预测特征;根据所述预测特征,使用第二预设模型预测所述待预测用户是否需要贷款,可根据获取的用户数据预测用户的贷款意愿,避免了对用户数据进行人工筛选的过程,避免了人工筛选的不准确导致预测不准确,且缩短了特征实验所需的时间周期,提高了模型预测的准确性及效率。

Description

一种用户贷款意愿的预测方法、装置及计算机系统
技术领域
本发明涉及机器学习领域,尤其涉及一种用户贷款意愿的预测方法、装置及计算机系统。
背景技术
近年来,数据挖掘技术在金融行业的使用越发深入及广泛。数据挖掘技术可以帮助金融行业分析及评估客户,帮助金融行业更好地挖掘潜在信息、规律并利用,以能够向客户提供更适合的产品。
对于金融行业而言,如何充分利用现有的数据指标资源,通过有效的算法模型挖掘出具有贷款需求、贷款意愿的客户是本领域亟需解决的问题。现有技术中,常常使用评分卡模型等线性模型评估预测用户是否具有贷款需求及贷款意愿。然而,这些模型的学习能力有限且需要人工对特征进行预筛选,且需进行大量的特征过程预分析,根据确定的有效的特征及特征组合来进行预测,耗费的时间长、所需的人力成本高且不一定能保证预测的准确性。
发明内容
为了解决现有技术的不足,本发明的主要目的在于提供一种用户贷款意愿的预测方法、装置及计算机系统。
为了达到上述目的,第一方面本发明提供了一种用户贷款意愿的预测方法,所述方法包括:
获取待预测用户的用户数据,所述用户数据包括所述待预测用户的用户属性及历史消费行为;
使用第一预设模型的多个预设分类器,分别根据所述用户数据生成对所述待预测用户所属分类的预测结果,所述预设分类器用于对用户进行分类;
整合每一所述预设分类器的预测结果,生成预测特征;
根据所述预测特征,使用第二预设模型预测所述待预测用户是否需要贷款。
在一些实施例中,所述第一预设模型通过迭代训练获得,所述第一预设模型的迭代训练过程包括:
使用获取的第一训练数据集训练第一预设模型,生成预设分类器,所述第一训练数据集包括历史用户数据及对应的用户在预设时间周期内是否发生贷款行为;
根据前一轮迭代训练生成的预设分类器的残差,迭代地训练第一预设模型,生成对应的预设分类器,直至所述第一预设模型满足对应的预设条件,所述第一预设模型由训练得到的多个所述预设分类器组成。
在一些实施例中,所述第一预设模型包括经训练的梯度提升随机树模型,所述第二预设模型包括经训练的逻辑回归模型。
在一些实施例中,所述第二预设模型的训练过程包括:
根据第一预设模型的每一预设分类器的预测结果,生成每一历史用户数据对应的预测特征;
根据所述历史用户数据对应的预测特征及对应的用户在预设时间周期内是否发生贷款行为,生成第二训练数据集;
使用所述第二训练数据集对所述第二预设模型进行训练。
在一些实施例中,所述整合每一所述预设分类器的预测结果,生成预测特征包括:
根据所述预设分类器的生成顺序,整合所述预测结果。
在一些实施例中,所述方法包括:
当预测所述待预测用户需要贷款时,确定所述待预测用户为目标用户,以便向所述目标用户推荐贷款产品。
第二方面,本申请提供了一种用户贷款意愿的预测装置,所述装置包括:
获取模块,用于获取待预测用户的用户数据,所述用户数据包括所述待预测用户的用户属性及历史消费行为;
处理模块,用于使用第一预设模型的多个预设分类器,分别根据所述用户数据生成对所述待预测用户所属分类的预测结果,所述预设分类器用于对用户进行分类;整合每一所述预设分类器的预测结果,生成预测特征;根据所述预测特征,使用第二预设模型预测所述待预测用户是否需要贷款。
在一些实施例中,所述装置包括训练模块,用于使用第一训练数据集训练第一预设模型,生成预设分类器,所述第一训练数据集包括历史用户数据及对应的用户在预设时间周期内是否发生贷款行为;根据前一轮迭代训练生成的预设分类器的残差,迭代地训练第一预设模型,生成对应的预设分类器,直至所述第一预设模型满足对应的预设条件,所述第一预设模型由训练得到的多个所述预设分类器组成。
在一些实施例中,所述训练模块还可用于根据第一预设模型的每一预设分类器的预测结果,生成每一历史用户数据对应的预测特征;根据所述历史用户数据对应的预测特征及对应的用户在预设时间周期内是否发生贷款行为,生成第二训练数据集;使用所述第二训练数据集对所述第二预设模型进行训练。
第三方面,本申请提供了一种计算机系统,所述系统包括:
一个或多个处理器;
以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
获取待预测用户的用户数据,所述用户数据包括所述待预测用户的用户属性及历史消费行为;
使用第一预设模型的多个预设分类器,分别根据所述用户数据生成对所述待预测用户所属分类的预测结果,所述预设分类器用于对用户进行分类;
整合每一所述预设分类器的预测结果,生成预测特征;
根据所述预测特征,使用第二预设模型预测所述待预测用户是否需要贷款。
本发明实现的有益效果为:
本申请提供了一种用户贷款意愿的预测方法,包括:获取待预测用户的用户数据,所述用户数据包括所述待预测用户的用户属性及历史消费行为;使用第一预设模型的多个预设分类器,分别根据所述用户数据生成对所述待预测用户所属分类的预测结果,所述预设分类器用于对用户进行分类;整合每一所述预设分类器的预测结果,生成预测特征;根据所述预测特征,使用第二预设模型预测所述待预测用户是否需要贷款,可根据获取的用户数据预测用户的贷款意愿,避免了对用户数据进行人工筛选的过程,避免了人工筛选的不准确导致预测不准确,且缩短了特征实验所需的时间周期,提高了模型预测的准确性及效率。
本发明所有产品并不需要具备上述所有效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的用户样本的提取示意图;
图2是本申请实施例提供的基于GBDT和逻辑回归融合模型与单一逻辑回归模型的ROC曲线图;
图3是本申请实施例提供的方法流程图;
图4是本申请实施例提供的装置结构图;
图5是本申请实施例提供的计算机系统结构图;
图6是本申请提供的基于GBDT和逻辑回归融合模型的模型结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如背景技术所述,为解决上述技术问题,本申请提供了一种用户贷款意愿的预测方法,由预先训练的第一预设模型的分类器根据获取的用户数据,对用户进行分类。然后对分类器的分类结果进行整合,生成预测特征,将该预测特征输入至第二预设模型,第二预设模型根据输入的预测特征预测用户的贷款意愿。
第一预设模型可以是梯度提升随机树(GBDT)模型,第二预设模型可以是逻辑回归(LR)模型,上述两个模型的训练过程包括:
S1、获取数据样本;
如图1所示,可选择一个预设时间点,获取在该时间点之后的三个月没有与预设金融平台发生交易等行为的用户。然后将在三个月过后的一周内与预设平台发生贷款行为的用户确定为正样本,将一周内未与预设金融平台发生贷款行为的用户确定为负样本。对确定为正样本及负样本的用户,需获取对应的历史用户数据,包括用户属性、用户金融行为及用户消费行为中的一个或多个。其中用户属性可以包括性别、年龄、手机号的归属地等用户的特征;用户金融行为包括用户在预设平台的金融会员等级、与预设平台绑定的贷记卡及借记卡等数据;用户消费行为包括用户在预设消费平台预设时间周期内的购买频次、消费金额等数据。
对获取的历史用户数据,需要进行数据清洗、数据转化、数据规范化等数据预处理操作,以生成对应的基础特征变量。
优选的,预设平台可以是向用户提供贷款等金融服务的平台。
优选的,可将获取的正样本及负样本中的70%作为训练数据集,30%作为测试数据集。
S2、使用训练数据集对模型进行训练;
优选的,可使用正样本包含的基础特征变量及负样本包含的基础特征变量对GBDT模型进行训练。GBDT模型在每次的迭代过程中会产生一个弱分类器即树,每一弱分类器根据上一轮迭代的弱分类器的残差进行训练,在经过预设数量的迭代的训练后,会产生预设数量经训练的弱分类器。每一弱分类器可根据用户数据对用户进行分类。
根据所有弱分类器的分类结果,可生成对应的预测特征。例如,GBDT模型生成了两个弱分类器T1、T2,两个弱分类器的叶节点个数分别为3个和2个, Li,j表示第i个分类器将样本分类到第j个叶节点上,即以样本X1为例:
样本X1在第1个分类器上被分到第2个叶节点上,即L1,2,则该样本在T1上的向量表达为(0,1,0);
样本X1在第2个分类器上被分到第1个叶节点上,即L2,1,则该样本在T1上的向量表达为(1,0);
则样本X1根据整个GDBT模型得出的向量表达为(0,1,0,1,0)。
同理,每一样本的分类结果都会被表示为一个长度为5的0/1特征向量。
根据使用根据正样本和负样本分别生成的特征向量可训练逻辑回归模型,得到经训练的逻辑回归模型。
具体的,所述逻辑回归模型的输入变量可表示为
Figure DEST_PATH_IMAGE001
,其中
Figure 378369DEST_PATH_IMAGE002
表示通过GBDT模型训练得到的每条样本对应的0/1特征向量;逻辑回归模型可用公式表达为:
Figure DEST_PATH_IMAGE003
,其中
Figure 762687DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
是通过训练得到的预设参数。
如图6所示,训练得到的GBDT模型及逻辑回归模型即可形成一个融合的模型,并可使用测试数据集对模型进行测试,确定模型的预测效果。
具体的,使用上述模型可根据用户的用户数据进行用户的贷款意愿的预测,所述预测过程包括:
步骤一、获取目标用户的用户数据;
优选的,目标用户可以是预设时间周期内未在预设平台发生交易等行为的用户。
所述用户数据包括所述目标用户的用户属性、用户金融行为及用户消费行为中的一个或多个。
步骤二、将用户数据输入经训练的GDBT模型,经训练的GDBT模型的每一弱分类器根据用户数据预测目标用户的分类;
步骤三、将每一若分类器的分类结果进行整合,生成对应的预测向量;
步骤四、使用经训练的逻辑回归模型,根据预测向量,预测所述目标用户是否需要贷款。
图2为分别利用单一逻辑回归模型和基于GDBT和逻辑回归融合模型对预设用户群贷款意愿识别的模型ROC曲线(接收器工作特征曲线)结果,可以看出在测试数据集上基于GBDT和逻辑回归的融合模型相较于单一逻辑回归模型具有更好的预测结果。
实施例二
对应上述实施例,如图3所示,本申请提供了一种用户贷款意愿的预测方法,所述方法包括:
310、获取待预测用户的用户数据,所述用户数据包括所述待预测用户的用户属性及历史消费行为;
320、使用第一预设模型的多个预设分类器,分别根据所述用户数据生成对所述待预测用户所属分类的预测结果,所述预设分类器用于对用户进行分类;
330、整合每一所述预设分类器的预测结果,生成预测特征;
340、根据所述预测特征,使用第二预设模型预测所述待预测用户是否需要贷款。
优选的,所述方法包括:
350、当预测所述待预测用户需要贷款时,确定所述待预测用户为目标用户,以便向所述目标用户推荐贷款产品。
优选的,所述第一预设模型迭代训练获得,所述第一预设模型的迭代训练过程包括:
360、使用第一训练数据集训练第一预设模型,生成预设分类器,所述第一训练数据集包括历史用户数据及对应的用户在预设时间周期内是否发生贷款行为;
361、根据前一轮迭代训练生成的预设分类器的残差,迭代地训练第一预设模型,生成对应的预设分类器,直至所述第一预设模型满足预设条件,所述第一预设模型由训练得到的多个所述预设分类器组成。
优选的,所述整合每一所述预设分类器的预测结果,生成预测特征包括:
362、根据所述预设分类器的生成顺序,整合所述预测结果。
优选的,所述第二预设模型的训练过程包括:
363、根据第一预设模型的每一预设分类器的预测结果,生成每一历史用户数据对应的预测特征;
364、根据所述历史用户数据对应的预测特征及对应的用户在预设时间周期内是否发生贷款行为,生成第二训练数据集;
365、使用所述第二训练数据集对所述第二预设模型进行训练。
优选的,所述第二预设模型包括经训练的逻辑回归模型。
优选的,所述第一预设模型包括经训练的梯度提升随机树模型。
优选的,所述用户数据还包括所述待预测用户的历史金融行为。
实施例三
对应上述方法实施例,如图4所示,本申请提供了一种用户贷款意愿的预测装置,所述装置包括:
获取模块410,用于获取待预测用户的用户数据,所述用户数据包括所述待预测用户的用户属性及历史消费行为;
处理模块420,用于使用第一预设模型的多个预设分类器,分别根据所述用户数据生成对所述待预测用户所属分类的预测结果,所述预设分类器用于对用户进行分类;整合每一所述预设分类器的预测结果,生成预测特征;根据所述预测特征,使用第二预设模型预测所述待预测用户是否需要贷款。
优选的,装置包括训练模块430,用于使用第一训练数据集训练第一预设模型,生成预设分类器,所述第一训练数据集包括历史用户数据及对应的用户在预设时间周期内是否发生贷款行为;根据前一轮迭代训练生成的预设分类器的残差,迭代地训练第一预设模型,生成对应的预设分类器,直至所述第一预设模型满足对应的预设条件,所述第一预设模型由训练得到的多个所述预设分类器组成。
优选的,所述训练模块还可用于根据第一预设模型的每一预设分类器的预测结果,生成每一历史用户数据对应的预测特征;根据所述历史用户数据对应的预测特征及对应的用户在预设时间周期内是否发生贷款行为,生成第二训练数据集;使用所述第二训练数据集对所述第二预设模型进行训练。
优选的,所述第二预设模型包括经训练的逻辑回归模型。
优选的,所述第一预设模型包括经训练的梯度提升随机树模型。
优选的,所述用户数据还包括所述待预测用户的历史金融行为。
优选的,所述处理模块420还可用于根据所述预设分类器的生成顺序,整合所述预测结果。
优选的,所述处理模块420还可用于当预测所述待预测用户需要贷款时,确定所述待预测用户为目标用户,以便向所述目标用户推荐贷款产品。
实施例四
对应上述方法、设备及系统,本申请实施例四提供一种计算机系统,包括: 一个或多个处理器;以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
获取待预测用户的用户数据,所述用户数据包括所述待预测用户的用户属性及历史消费行为;
使用第一预设模型的多个预设分类器,分别根据所述用户数据生成对所述待预测用户所属分类的预测结果,所述预设分类器用于对用户进行分类;
整合每一所述预设分类器的预测结果,生成预测特征;
根据所述预测特征,使用第二预设模型预测所述待预测用户是否需要贷款。
其中,图5示例性的展示出了计算机系统的架构,具体可以包括处理器1510,视频显示适配器1511,磁盘驱动器1512,输入/输出接口1513,网络接口1514,以及存储器1520。上述处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,与存储器1520之间可以通过通信总线1530进行通信连接。
其中,处理器1510可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请所提供的技术方案。
存储器1520可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1520可以存储用于控制计算机系统1500运行的操作系统1521,用于控制计算机系统1500的低级别操作的基本输入输出系统(BIOS)1522。另外,还可以存储网页浏览器1523,数据存储管理1524,以及图标字体处理系统1525等等。上述图标字体处理系统1525就可以是本申请实施例中具体实现前述各步骤操作的应用程序。总之,在通过软件或者固件来实现本申请所提供的技术方案时,相关的程序代码保存在存储器1520中,并由处理器1510来调用执行。 输入/输出接口1513用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
网络接口1514用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1530包括一通路,在设备的各个组件(例如处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,与存储器1520)之间传输信息。
另外,该计算机系统1500还可以从虚拟资源对象领取条件信息数据库1541中获得具体领取条件的信息,以用于进行条件判断,等等。
需要说明的是,尽管上述设备仅示出了处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,存储器1520,总线1530等,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本申请方案所必需的组件,而不必包含图中所示的全部组件。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,云服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用户贷款意愿的预测方法,其特征在于,所述方法包括:
获取待预测用户的用户数据,所述用户数据包括所述待预测用户的用户属性及历史消费行为;
使用第一预设模型的多个预设分类器,分别根据所述用户数据生成对所述待预测用户所属分类的预测结果,所述预设分类器用于对用户进行分类;
整合每一所述预设分类器的预测结果,生成预测特征;
根据所述预测特征,使用第二预设模型预测所述待预测用户是否需要贷款。
2.根据权利要求1所述的方法,其特征在于,所述第一预设模型通过迭代训练获得,所述第一预设模型的迭代训练过程包括:
使用获取的第一训练数据集训练第一预设模型,生成预设分类器,所述第一训练数据集包括历史用户数据及对应的用户在预设时间周期内是否发生贷款行为;
根据前一轮迭代训练生成的预设分类器的残差,迭代地训练第一预设模型,生成对应的预设分类器,直至所述第一预设模型满足对应的预设条件,所述第一预设模型由训练得到的多个所述预设分类器组成。
3.根据权利要求1或2所述的方法,其特征在于,所述第一预设模型包括经训练的梯度提升随机树模型,所述第二预设模型包括经训练的逻辑回归模型。
4.根据权利要求2所述的方法,其特征在于,所述第二预设模型的训练过程包括:
根据第一预设模型的每一预设分类器的预测结果,生成每一历史用户数据对应的预测特征;
根据所述历史用户数据对应的预测特征及对应的用户在预设时间周期内是否发生贷款行为,生成第二训练数据集;
使用所述第二训练数据集对所述第二预设模型进行训练。
5.根据权利要求2所述的方法,其特征在于,所述整合每一所述预设分类器的预测结果,生成预测特征包括:
根据所述预设分类器的生成顺序,整合所述预测结果。
6.根据权利要求1或2所述的方法,其特征在于,所述方法包括:
当预测所述待预测用户需要贷款时,确定所述待预测用户为目标用户,以便向所述目标用户推荐贷款产品。
7.一种用户贷款意愿的预测装置,其特征在于,所述装置包括:
获取模块,用于获取待预测用户的用户数据,所述用户数据包括所述待预测用户的用户属性及历史消费行为;
处理模块,用于使用第一预设模型的多个预设分类器,分别根据所述用户数据生成对所述待预测用户所属分类的预测结果,所述预设分类器用于对用户进行分类;整合每一所述预设分类器的预测结果,生成预测特征;根据所述预测特征,使用第二预设模型预测所述待预测用户是否需要贷款。
8.根据权利要求7所述的预测装置,其特征在于,所述装置包括训练模块,用于使用第一训练数据集训练第一预设模型,生成预设分类器,所述第一训练数据集包括历史用户数据及对应的用户在预设时间周期内是否发生贷款行为;根据前一轮迭代训练生成的预设分类器的残差,迭代地训练第一预设模型,生成对应的预设分类器,直至所述第一预设模型满足对应的预设条件,所述第一预设模型由训练得到的多个所述预设分类器组成。
9.根据权利要求8所述的预测装置,其特征在于,所述训练模块还可用于根据第一预设模型的每一预设分类器的预测结果,生成每一历史用户数据对应的预测特征;根据所述历史用户数据对应的预测特征及对应的用户在预设时间周期内是否发生贷款行为,生成第二训练数据集;使用所述第二训练数据集对所述第二预设模型进行训练。
10.一种计算机系统,其特征在于,所述系统包括:
一个或多个处理器;
以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
获取待预测用户的用户数据,所述用户数据包括所述待预测用户的用户属性及历史消费行为;
使用第一预设模型的多个预设分类器,分别根据所述用户数据生成对所述待预测用户所属分类的预测结果,所述预设分类器用于对用户进行分类;
整合每一所述预设分类器的预测结果,生成预测特征;
根据所述预测特征,使用第二预设模型预测所述待预测用户是否需要贷款。
CN202011043449.8A 2020-09-28 2020-09-28 一种用户贷款意愿的预测方法、装置及计算机系统 Pending CN112328869A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011043449.8A CN112328869A (zh) 2020-09-28 2020-09-28 一种用户贷款意愿的预测方法、装置及计算机系统
CA3135466A CA3135466A1 (en) 2020-09-28 2021-09-28 User loan willingness prediction method and device and computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011043449.8A CN112328869A (zh) 2020-09-28 2020-09-28 一种用户贷款意愿的预测方法、装置及计算机系统

Publications (1)

Publication Number Publication Date
CN112328869A true CN112328869A (zh) 2021-02-05

Family

ID=74303290

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011043449.8A Pending CN112328869A (zh) 2020-09-28 2020-09-28 一种用户贷款意愿的预测方法、装置及计算机系统

Country Status (2)

Country Link
CN (1) CN112328869A (zh)
CA (1) CA3135466A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112785095A (zh) * 2021-03-12 2021-05-11 北京顶象技术有限公司 贷款预测方法、装置、电子设备和计算机可读存储介质
CN113065946A (zh) * 2021-03-17 2021-07-02 上海浦东发展银行股份有限公司 一种信用卡证件过期客户分类促更新方法、装置及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116071103A (zh) * 2023-03-07 2023-05-05 天津金城银行股份有限公司 促使客户借款的方法、装置和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107895277A (zh) * 2017-09-30 2018-04-10 平安科技(深圳)有限公司 在应用程序中推送贷款广告的方法、电子装置及介质
CN110971460A (zh) * 2019-12-03 2020-04-07 北京红山信息科技研究院有限公司 一种离网预测方法、装置、服务器和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107895277A (zh) * 2017-09-30 2018-04-10 平安科技(深圳)有限公司 在应用程序中推送贷款广告的方法、电子装置及介质
CN110971460A (zh) * 2019-12-03 2020-04-07 北京红山信息科技研究院有限公司 一种离网预测方法、装置、服务器和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112785095A (zh) * 2021-03-12 2021-05-11 北京顶象技术有限公司 贷款预测方法、装置、电子设备和计算机可读存储介质
CN113065946A (zh) * 2021-03-17 2021-07-02 上海浦东发展银行股份有限公司 一种信用卡证件过期客户分类促更新方法、装置及存储介质

Also Published As

Publication number Publication date
CA3135466A1 (en) 2022-03-28

Similar Documents

Publication Publication Date Title
EP3985578A1 (en) Method and system for automatically training machine learning model
CN106095942B (zh) 强变量提取方法及装置
CN112328869A (zh) 一种用户贷款意愿的预测方法、装置及计算机系统
CN107729915A (zh) 用于确定机器学习样本的重要特征的方法及系统
CN111340240A (zh) 实现自动机器学习的方法及装置
CN112598294A (zh) 在线建立评分卡模型的方法、装置、机器可读介质及设备
CN114004700A (zh) 业务数据处理方法、装置、电子设备及存储介质
CN113205403A (zh) 一种企业信用等级的计算方法、装置、存储介质及终端
CN111783039A (zh) 风险确定方法、装置、计算机系统和存储介质
CN112686312A (zh) 一种数据分类方法、装置及系统
CN113592605A (zh) 基于相似产品的产品推荐方法、装置、设备及存储介质
CN111210332A (zh) 贷后管理策略生成方法、装置及电子设备
CN113919432A (zh) 一种分类模型构建方法、数据分类方法及装置
CN116578925B (zh) 基于特征画像的行为预测方法、装置及存储介质
CN111553685B (zh) 确定交易路由通道的方法、装置、电子设备和存储介质
CN117421491A (zh) 社交媒体账号运行数据的量化方法、装置及电子设备
CN110796381B (zh) 风控模型的建模方法、装置、终端设备及介质
CN110544166A (zh) 样本生成方法、装置及存储介质
CN113392920B (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
CN114897607A (zh) 产品资源的数据处理方法及装置、电子设备、存储介质
CN116823407B (zh) 产品信息推送方法、装置、电子设备和计算机可读介质
CN113689288B (zh) 基于实体列表的风险识别方法、装置、设备及存储介质
CN116340864B (zh) 一种模型漂移检测方法、装置、设备及其存储介质
CN117541885A (zh) 样本数据处理方法、装置、存储介质和系统
CN116701765A (zh) 一种对象推荐方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210205