CN111080338A - 用户数据的处理方法、装置、电子设备及存储介质 - Google Patents
用户数据的处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111080338A CN111080338A CN201911092874.3A CN201911092874A CN111080338A CN 111080338 A CN111080338 A CN 111080338A CN 201911092874 A CN201911092874 A CN 201911092874A CN 111080338 A CN111080338 A CN 111080338A
- Authority
- CN
- China
- Prior art keywords
- user
- information
- model
- expected
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 238000003672 processing method Methods 0.000 title description 5
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000011156 evaluation Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims description 62
- 230000006870 function Effects 0.000 claims description 41
- 238000004590 computer program Methods 0.000 claims description 13
- 238000007477 logistic regression Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000003062 neural network model Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000013210 evaluation model Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Technology Law (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种用户数据的处理方法、装置、电子设备及存储介质,其中,该方法包括:获取用户特征数据,用户特征数据包括:用户个人信息;将用户特征数据输入至已训练的多目标模型进行预测操作,以输出与用户特征数据相应的预期信息,预期信息包括:是否办理业务信息和预期收益信息,多目标模型包括:用于生成是否办理业务信息的业务子模型、以及用于生成预期收益信息的预期子模型;根据预期信息生成用户评估信息。通过本发明,可以准确得知用户所能带来的预期收益,从而可以准确评估用户价值。
Description
技术领域
本发明涉及数据处理领域,具体涉及一种用户数据的处理方法、装置、电子设备及存储介质。
背景技术
在当前的一些金融场景中,由于金融机构的营销资源和营销费用是有限的,如何用有限的营销资源得到尽可能多的经济收益,这就需要金融机构对用户进行价值评估,从海量备选用户中挑选出高价值用户,针对高价值用户投放营销资源。
目前,对于用户价值评估的难点主要包含两个方面:
(一)用户价值受到多方面因素的影响,这些因素包括:用户对于金融机构的忠诚度和认可度(例如,羊毛党)、对于金融机构营销手段的感兴趣程度(例如,用户是否愿意响应)、用户所能带来的潜在收益以及用户可能造成的坏账和违约风险等(例如,一些通过养卡等行为进行信用卡欺诈的用户)。
(二)对用户价值评定需要直观、容易理解、并且足够细化。
对于将用户价值分为高中低三种分等的评估方式,在海量规模用户的情况下,这种粗放的分等方式对于金融机构并没有多少指导意义。
目前,金融行业对于用户价值评估,普遍采用的是评分卡方法。该方法根据来自金融机构系统和第三方机构(例如,人行征信)的用户数据、通过对用户数据进行预处理、分箱处理构建评分卡模型,对潜在用户进行评分。
但是,这种评分并未有实际意义,因为很难清楚得知90分的用户和85分的用户,能给金融机构带来的收益差距到底有多大,也就是说,无法准确地评估用户价值。
发明内容
有鉴于此,本发明提供一种用户数据的处理方法、装置、电子设备及存储介质,以解决上述提及的目前的金融机构无法准确评估用户价值的问题。
根据本发明的第一方面,提供一种用户数据的处理方法,所述方法包括:获取用户特征数据,所述用户特征数据包括:用户个人信息;将所述用户特征数据输入至已训练的多目标模型进行预测操作,以输出与所述用户特征数据相应的预期信息,所述预期信息包括:是否办理业务信息和预期收益信息,所述多目标模型包括:用于生成是否办理业务信息的业务子模型、以及用于生成所述预期收益信息的预期子模型;根据所述预期信息生成用户评估信息。
根据本发明的第二方面,提供一种用户数据的处理装置,所述装置包括:特征数据获取单元,用于获取用户特征数据,所述用户特征数据包括:用户个人信息;预测单元,用于将所述用户特征数据输入至已训练的多目标模型进行预测操作,以输出与所述用户特征数据相应的预期信息,所述预期信息包括:是否办理业务信息和预期收益信息,所述多目标模型包括:用于生成是否办理业务信息的业务子模型、以及用于生成所述预期收益信息的预期子模型;评估信息生成单元,用于根据所述预期信息生成用户评估信息。
根据本发明的第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述用户数据的处理方法的步骤。
根据本发明的第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述用户数据的处理方法的步骤。
由上述技术方案可知,通过将获取的用户特征数据输入至训练好的多目标模型进行预测,得到是否办理业务信息和预期收益信息,以此来生成用户评估信息,由于预测了预期收益信息,因而可以准确地得知用户所能带来的预期收益,相比于现有技术,本发明可以准确得知用户所能带来的预期收益,从而可以准确评估用户价值。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的用户数据处理方法的流程图;
图2是根据本发明实施例的用户样本和特征收集流程示意图;
图3是根据本发明实施例的多目标模型的构建示意图;
图4是根据本发明实施例的用户数据处理装置的结构框图;
图5是根据本发明实施例的用户数据处理装置的详细结构框图;
图6是根据本发明实施例的模型训练单元44的详细结构框图;
图7是根据本发明实施例的预测单元42的详细结构框图;
图8是根据本发明实施例的电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,对于一般消费场景的推荐排序,诸如广告、商品推荐等,商户主要关心的指标是转化率,即,这个用户最终是否会产生转化,生成订单。然而,在一些常见的金融场景中,诸如小贷、信用卡推广,金融机构关心的不仅仅是转化,金融场景下所产生的成本比一般消费场景更多且更复杂,除了资金成本以外,风险成本也是金融场景下进行营销所需要考虑的问题。因此,对于金融场景下的一些营销活动,金融机构实际关心的是转化率之后更进一步的目标,即,用户所能带来的价值(例如,期望收益)。而现有的评分卡方法很难清楚得知用户能给金融机构带来的收益,因而无法准确地评估用户价值。
基于此,本发明实施例提供一种用户数据处理方案,以克服上述问题,以实现对用户价值的准确评估。
图1是根据本发明实施例的用户数据处理方法的流程图,如图1所示,该方法包括:
步骤101,获取用户特征数据,所述用户特征数据包括:用户个人信息,例如,用户的年龄、性别、学历、工作情况、收入等;
步骤102,将所述用户特征数据输入至已训练的多目标模型,以输出与所述用户特征数据相应的预期信息,所述预期信息包括:是否办理业务信息和预期收益信息,所述多目标模型包括:用于生成是否办理业务信息的业务子模型、以及用于生成所述预期收益信息的预期子模型;
步骤103,根据所述预期信息生成用户评估信息。
通过将获取的用户特征数据输入至训练好的多目标模型进行预测,得到是否办理业务信息和预期收益信息,以此来生成用户评估信息,由于预测了预期收益信息,因而可以准确地得知用户所能带来的预期收益,相比于现有技术,本发明实施例可以准确得知用户所能带来的预期收益,从而可以准确评估用户价值。
上述的多目标模型优选地为神经网络模型,具体可以通过如下方式来训练:获取历史用户数据,所述历史用户数据包括:历史用户特征数据、历史用户是否办理业务信息以及历史用户的业务收益信息;将所述历史用户数据输入至未训练的初始多目标模型,并基于预定训练输出函数来训练所述初始多目标模型,其中,所述初始多目标模型包括:初始业务子模型和初始预期子模型。
具体而言,根据所述历史用户特征数据和历史用户是否办理业务信息来训练所述初始业务子模型,来得到上述业务子模型;同时,根据所述历史用户特征数据和历史用户的业务收益信息,基于上述预定训练输出函数来训练所述初始预期子模型,以得到上述预期子模型。这里的预定训练输出函数可以是带权逻辑回归函数,也就是说,带权逻辑回归函数作为预期子模型的输出函数。
在一个实施例中,预定训练输出函数可以通过如下公式来表示:
其中,hθ(x)表示模型的输出值,w表示所述历史用户的业务收益信息,θ表示模型参数,该参数通过训练过程中拟合样本数据得到,x表示所述历史用户特征数据。
在步骤102的预测阶段,首先将潜在用户的用户特征数据输入至已训练的多目标模型中;之后基于预定预测输出函数,多目标模型对所述用户特征数据进行预测,输出预期信息,该预期信息包括:是否办理业务信息和预期收益信息。
在一个实施例中,预定预测输出函数可以通过如下公式来表示:
y=eθx+b
其中,y表示所述预期收益信息,θ表示模型参数,该参数通过训练过程中拟合样本数据得到,x表示所述用户特征数据,b表示偏置参数,该偏置参数属于模型参数的一部分,影响整个函数在坐标轴上的位置偏移,该参数通过训练过程中拟合样本数据得到。
在实际操作中,多目标模型是相对于普通模型来说的,对于普通模型,一个模型只会优化一个目标值,而多目标模型会在同一个模型中优化多个不同目标值,目的是希望通过引入辅助目标来帮助模型训练学习主要目标,提升主要目标的训练学习效果,例如,在本发明实施例的用户数据处理方法中,用户是否办理业务信息是作为辅助目标存在的,而模型要训练学习的主要目标是收益信息,即,用户给金融机构带来的收益。
为了更好地理解本发明实施例,以下以金融场景中的信用卡推广业务为例来详细描述本发明实施例。
在该示例中,首先描述用户样本和特征的收集,之后描述根据收集的信息构建多目标模型。以下对这两部分分别进行详细描述。
图2是根据本发明实施例的用户样本和特征收集流程示意图,如图2所示,该流程包括:
步骤201,用户触达推荐信用卡。
在信用卡推广场景中,作业人员触达用户(或者称为潜在用户),表明信用卡办理邀约之后,用户一般会有两种选择,第一种是接受邀约办理信用卡,第二种是拒绝邀约离开,此时,作业人员需要收集用户是否办理信用卡的信息,如果接受办理邀约,则在相应的标志位标记为1,将该用户标注为正样本,否则标记为0,标注为负样本,这些数据统一存储在样本库,以记录用户是否转化。
步骤202,用户注册填写基本个人信息。
当用户同意办理信用卡之后,需要邀请用户在系统中填写更加详细的个人信息,具体可以包括:年龄、性别、收入、学历、工作情况等,这些信息将存储至特征库,用于记录用户的基本信息。
步骤203,跟踪用户后续消费和还款情况。
在信用卡办理完成之后,需要跟踪用户的消费和还款情况,记录用户为金融机构带来的收益情况。当用户正常消费还款时,用户给金融机构带来的是正收益,可以用正数记录金融机构从该用户身上获取的收益;而当用户发生逾期或者坏账时,则以负数记录金融机构在用户身上的损失。例如,用户特征以x表示,y表示用户带给金融机构的收益,在本发明实施例中,上述多目标模型最终要预测的是y值。当用户逾期对金融机构造成了1000元的损失时,此时y值就是-1000;当用户给金融机构带来了1000的收益时,此时y值就是1000。这些信息会存储在样本库,记录用户带来的收益情况。
在信用卡推广场景中,用户由初次触达到转换,再到最终为金融机构带来收益是一个递进的关系。因此,在本发明实施例中,将这种递进关系的表达加入到了用户价值评估模型,优选地该用户价值评估模型采用的是改进的多目标模型。
如上所述,多目标模型是相对于普通模型来说的,对于普通的模型,一个模型只会优化一个目标值y值,而多目标模型会在同一个模型中优化多个不同的目标值,目的是希望通过引入辅助目标来帮助模型学习主要目标,提升主要目标的学习效果,例如,在本发明实施例的用户价值评估过程中,用户是否办理信用卡是作为辅助目标存在的,而模型要优化的主要目标是用户给金融机构带来的收益。
在训练模型时,需要将上述收集的样本库和特征库的数据输入到模型当中。其中,模型的一侧输出仅根据样本中是否接受办理邀约的标志位值,对网络中各层神经元的梯度进行更新。而模型的另一侧输出仅根据样本中,用户带来的收益值,对网络中各层神经元的梯度进行更新。当模型训练收敛后,便可以依据特征库中的数据对用户的价值进行评估。以下结合图3详细描述该模型。
图3是根据本发明实施例的多目标模型(也可以称为用户价值评估模型)的构建示意图,如图3所示,该多目标模型主体部分采用了三层全连接层的结构,每一层可以采用Relu(Rectified Linear Unit,修正线性单元)作为激活函数。该部分模型采用神经网络,整个神经网络包含三个隐层(Hidden layer),可以理解为三个隐层组合起来代表了一个y=f(x)的多项式。
具体地,对于该示例中的模型,每一层的表达式为y=max(0,θTx),其中y为该隐层的输出值,x为输入值(即上一个隐层的输出值),θ为该隐层的参数,具体可以根据实际情况来设置。
从第四层隐层开始,模型拆分出两个分支,其中,左侧分支(对应于上述业务子模型)作为“用户是否接受信用卡办理邀约”这一目标的输出和优化反馈方向,根据模型直接输出来优化模型。第四层跟前面三层相同,都是全连接隐层,同样是对数据进行y=f(x)的变换,其中,x是上一个隐层的输出。具体的式子同样是y=max(0,θTx)。在模型预测阶段,可以采用sigmoid(神经网络的一种激活函数)函数进行预测“用户是否接受信用卡办理邀约”。
模型的右侧分支(对应于上述预期子模型)作为”用户带给机构的收益”这一目标的输出和优化反馈方向,这个分支模型与传统的分类模型输出是不同的。在模型训练阶段,使用带权逻辑回归作为模型的输出函数进行优化,参见如下公式:
其中,hθ(x)表示模型的输出值,w表示训练模型所使用的样本用户给金融机构带来的收益,θ表示神经网络模型中的参数,参数通过模型训练过程中拟合样本得到,x表示样本的特征,例如,用户的年龄,性别等。
在模型的预测阶段使用如下函数:
y=eθx+b
其中,y是模型的输出值,即我们最终通过模型预测得到的收益信息,表示用户价值评估值;θ表示神经网络模型中的参数,参数通过模型训练过程中拟合样本得到;x表示样本的特征,例如,用户的年龄,性别等;b为偏置参数,该偏置参数属于模型参数的一部分,影响整个函数在坐标轴上的位置偏移,该参数可以通过模型训练过程中拟合样本得到。
需要说明的是,两个分支的输出分别代表两个目标,不同的目标更新对应部分网络结构的参数θ。
由以上描述可知,有别于传统的分类模型,只能预测用户是否能带来正收益的概率,本发明实施例构建的多目标模型的输出函数考虑了用户为金融机构带来的收益和风险,从而使得多目标模型能够预测出用户所能带来的收益期望,进而可以评估用户价值。
基于相似的发明构思,本发明实施例还提供一种用户数据的处理装置,图4是该装置的结构框图,如图4所示,该装置包括:特征数据获取单元41、预测单元42和评估信息生成单元43,其中:
特征数据获取单元41,用于获取用户特征数据,所述用户特征数据包括:用户个人信息,例如,用户的年龄、性别、学历、工作情况、收入等;
预测单元42,用于将所述用户特征数据输入至已训练的多目标模型进行预测操作,以输出与所述用户特征数据相应的预期信息,所述预期信息包括:是否办理业务信息和预期收益信息,所述多目标模型包括:用于生成是否办理业务信息的业务子模型、以及用于生成所述预期收益信息的预期子模型;
评估信息生成单元43,用于根据所述预期信息生成用户评估信息。
通过预测单元42将特征数据获取单元41获取的用户特征数据输入至训练好的多目标模型进行预测,得到是否办理业务信息和预期收益信息,以此评估信息生成单元43生成用户评估信息,由于预测了预期收益信息,因而可以准确地得知用户所能带来的预期收益,相比于现有技术,本发明实施例可以准确得知用户所能带来的预期收益,从而可以准确评估用户价值。
在具体实施过程中,如图5所示,上述装置还包括:模型训练单元44,用于训练多目标模型,以便于预测单元42根据训练好的多目标模型对用户数据进行预测,得到预期信息。优选地,本发明实施例中的多目标模型可以为神经网络模型。
图6是该模型训练单元44的结构框图,如图6所示,该模型训练单元44具体包括:历史数据获取模块441和模型训练模块442,其中:
历史数据获取模块441,用于获取历史用户数据,所述历史用户数据包括:历史用户特征数据、历史用户是否办理业务信息以及历史用户的业务收益信息;
模型训练模块442,用于将所述历史用户数据输入至未训练的初始多目标模型,并基于预定训练输出函数来训练所述初始多目标模型,其中,所述初始多目标模型包括:初始业务子模型和初始预期子模型。
上述模型训练模块442具体包括:第一模型训练子模块4421和第二模型训练子模块4422:
第一模型训练子模块4421,用于根据所述历史用户特征数据(例如,年龄、性别、收入、学历、工作情况等)和所述历史用户是否办理业务信息来训练所述初始业务子模型,以得到上述业务子模型。历史用户是否办理业务信息可以通过设置相应标志位来表示,例如,用户接受办理邀约,则在相应标志位标记为1,将该用户标注为正样本,否则标记为0,标注为负样本,这些数据统一存储在样本库,以记录用户是否转化。
第二模型训练子模块4422,用于根据所述历史用户特征数据和所述历史用户的业务收益信息,基于所述预定训练输出函数来训练所述初始预期子模型,以得到上述预期子模型。这里的预定训练输出函数可以是带权逻辑回归函数。
例如,当业务为信用卡时,用户正常消费还款,则表示用户给金融机构带来的是正收益,可以用正数记录金融机构从该用户身上获取的收益,而当用户发生逾期或者坏账时,则表示用户给金融机构带来的是负收益、损失,可以以负数记录金融机构在用户身上的损失。
在一个实施例中,第二模型训练子模块4422的预定训练输出函数可以通过如下公式来表示:
其中,hθ(x)表示模型的输出值,w表示所述历史用户的业务收益信息,θ表示模型参数,该参数通过训练过程中拟合样本数据得到,x表示所述历史用户特征数据。
通过将历史数据获取模块441获取的历史用户数据输入至第一模型训练子模块4421和第二模型训练子模块4422进行模型训练,可以得到训练好的模型,以供预测单元42预测潜在用户的预期信息,从而可以评估用户价值。
图7是预测单元42的结构框图,如图7所示,该预测单元42包括:数据输入模块421和预测模块422,其中:
数据输入模块421,用于将所述用户特征数据输入至已训练的多目标模型;
预测模块422,用于基于预定预测输出函数,所述多目标模型对所述用户特征数据进行预测操作,以输出所述预期信息。
在一个实施例中,预测模块422的预定预测输出函数可以通过如下公式来表示:
y=eθx+b
其中,y表示所述预期收益信息;θ表示模型参数,该参数通过训练过程中拟合样本数据得到;x表示所述用户特征数据;b表示偏置参数,该偏置参数属于模型参数的一部分,影响整个函数在坐标轴上的位置偏移,该参数可以通过模型训练过程中拟合样本得到。
由以上描述可知,本发明实施例训练多目标模型时考虑了用户为金融机构带来的收益和风险(即,损失),从而使得训练好的多目标模型能够预测出用户所能带来的收益期望,进而可以评估用户价值,通过本发明实施例提供的预测单元可以给出直观地结果,并且可以全方位地衡量用户价值。
上述各单元、各模块、各子模块的具体执行过程可以参见上述方法实施例中的描述,此处不再赘述。
在实际操作中,上述各单元、各模块、各子模块可以单一设置、也可以合一、或组合设置,本发明不限于此。
图8是根据本发明实施例的电子设备的示意图。图8所示的电子设备为通用数据处理装置,其包括通用的计算机硬件结构,其至少包括处理器801和存储器802。处理器801和存储器802通过总线803连接。存储器802适于存储处理器801可执行的一条或多条指令或程序。该一条或多条指令或程序被处理器801执行以实现上述用户数据的处理方法中的步骤。
上述处理器801可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器801通过执行存储器802所存储的命令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其他装置的控制。总线803将上述多个组件连接在一起,同时将上述组件连接到显示控制器804和显示装置以及输入/输出(I/O)装置805。输入/输出(I/O)装置805可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出(I/O)装置805通过输入/输出(I/O)控制器806与系统相连。
其中,存储器802可以存储软件组件,例如操作系统、通信模块、交互模块以及应用程序。以上所述的每个模块和应用程序都对应于完成一个或多个功能和在发明实施例中描述的方法的一组可执行程序指令。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时以实现上述用户数据的处理方法的步骤。
综上所述,本发明实施例提供了一种在金融场景下用户价值评估方案,通过获取用户在一些金融场景下是否完成最终的转化、转化之后是否违约以及最终给金融机构带来的收益(损失)信息来训练神经网络模型,最终将训练好的多目标模型用于预测潜在用户的预期收益,从而实现对用户价值的评估。相对于现有技术中的评分方法,本发明实施例更加高效快捷、能够降低模型的开发成本,增强模型对于不同特征的兼容性、鲁棒性和可扩展性,其具体的优点如下:
(1)与传统的评分卡模型相比,本发明实施例的多目标模型对于建模人员的要求相对较低,不需要建模人员具有太多的业务经验;并且,多目标模型能够减少特征处理,特别是在特征分箱上的工作量,能够减轻建模人员的工作负担。
(2)多目标模型能够更好的兼容不同类型的特征,特征在简单的处理后,通过修改配置就可以快速的接入,提高了模型迭代的效率;同时,多目标模型具有更好的鲁棒性,能够解决由于数据分布的变化导致评分卡失效的问题。
以上参照附图描述了本发明的优选实施方式。这些实施方式的许多特征和优点根据该详细的说明书是清楚的,因此权利要求旨在覆盖这些实施方式的落入其真实精神和范围内的所有这些特征和优点。此外,由于本领域的技术人员容易想到很多修改和改变,因此不是要将本发明的实施方式限于所例示和描述的精确结构和操作,而是可以涵盖落入其范围内的所有合适修改和等同物。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种用户数据的处理方法,其特征在于,所述方法包括:
获取用户特征数据,所述用户特征数据包括:用户个人信息;
将所述用户特征数据输入至已训练的多目标模型进行预测操作,以输出与所述用户特征数据相应的预期信息,所述预期信息包括:是否办理业务信息和预期收益信息,所述多目标模型包括:用于生成是否办理业务信息的业务子模型、以及用于生成所述预期收益信息的预期子模型;
根据所述预期信息生成用户评估信息。
2.根据权利要求1所述的用户数据的处理方法,其特征在于,通过如下方式训练所述多目标模型:
获取历史用户数据,所述历史用户数据包括:历史用户特征数据、历史用户是否办理业务信息以及历史用户的业务收益信息;
将所述历史用户数据输入至未训练的初始多目标模型,并基于预定训练输出函数来训练所述初始多目标模型,其中,所述初始多目标模型包括:初始业务子模型和初始预期子模型。
3.根据权利要求2所述的用户数据的处理方法,其特征在于,将所述历史用户数据输入至未训练的初始多目标模型,并基于预定训练输出函数来训练所述初始多目标模型包括:
根据所述历史用户特征数据和所述历史用户是否办理业务信息来训练所述初始业务子模型,以得到所述业务子模型;
根据所述历史用户特征数据和所述历史用户的业务收益信息,基于所述预定训练输出函数来训练所述初始预期子模型,以得到所述预期子模型。
4.根据权利要求3所述的用户数据的处理方法,其特征在于,所述预定训练输出函数为带权逻辑回归函数。
5.根据权利要求1所述的用户数据的处理方法,其特征在于,将所述用户特征数据输入至已训练的多目标模型,以输出与所述用户特征数据相应的预期信息包括:
将所述用户特征数据输入至已训练的多目标模型;
基于预定预测输出函数,所述多目标模型对所述用户特征数据进行预测操作,以输出所述预期信息。
6.一种用户数据的处理装置,其特征在于,所述装置包括:
特征数据获取单元,用于获取用户特征数据,所述用户特征数据包括:用户个人信息;
预测单元,用于将所述用户特征数据输入至已训练的多目标模型进行预测操作,以输出与所述用户特征数据相应的预期信息,所述预期信息包括:是否办理业务信息和预期收益信息,所述多目标模型包括:用于生成是否办理业务信息的业务子模型、以及用于生成所述预期收益信息的预期子模型;
评估信息生成单元,用于根据所述预期信息生成用户评估信息。
7.根据权利要求6所述的用户数据的处理装置,其特征在于,所述装置还包括:
模型训练单元,用于训练所述多目标模型,
所述模型训练单元包括:
历史数据获取模块,用于获取历史用户数据,所述历史用户数据包括:历史用户特征数据、历史用户是否办理业务信息以及历史用户的业务收益信息;
模型训练模块,用于将所述历史用户数据输入至未训练的初始多目标模型,并基于预定训练输出函数来训练所述初始多目标模型,其中,所述初始多目标模型包括:初始业务子模型和初始预期子模型。
8.根据权利要求7所述的用户数据的处理装置,其特征在于,所述模型训练模块包括:
第一模型训练子模块,用于根据所述历史用户特征数据和所述历史用户是否办理业务信息来训练所述初始业务子模型,以得到所述业务子模型;
第二模型训练子模块,用于根据所述历史用户特征数据和所述历史用户的业务收益信息,基于所述预定训练输出函数来训练所述初始预期子模型,以得到所述预期子模型。
9.根据权利要求8所述的用户数据的处理装置,其特征在于,所述第二模型训练子模块中的预定训练输出函数为带权逻辑回归函数。
10.根据权利要求6所述的用户数据的处理装置,其特征在于,所述预测单元包括:
数据输入模块,用于将所述用户特征数据输入至已训练的多目标模型;
预测模块,用于基于预定预测输出函数,所述多目标模型对所述用户特征数据进行预测操作,以输出所述预期信息。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至5中任一项所述用户数据的处理方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至5中任一项所述用户数据的处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911092874.3A CN111080338B (zh) | 2019-11-11 | 2019-11-11 | 用户数据的处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911092874.3A CN111080338B (zh) | 2019-11-11 | 2019-11-11 | 用户数据的处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111080338A true CN111080338A (zh) | 2020-04-28 |
CN111080338B CN111080338B (zh) | 2024-05-24 |
Family
ID=70310828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911092874.3A Active CN111080338B (zh) | 2019-11-11 | 2019-11-11 | 用户数据的处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111080338B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639257A (zh) * | 2020-05-09 | 2020-09-08 | 北京三快在线科技有限公司 | 信息显示方法、装置、存储介质和电子设备 |
CN111681050A (zh) * | 2020-06-05 | 2020-09-18 | 深圳市卡牛科技有限公司 | 一种广告推送方法、装置、设备和存储介质 |
CN112163155A (zh) * | 2020-09-30 | 2021-01-01 | 深圳前海微众银行股份有限公司 | 信息处理方法、装置、设备及存储介质 |
CN112215348A (zh) * | 2020-09-09 | 2021-01-12 | 广州小迈网络科技有限公司 | 广告投放信息处理方法 |
CN112990583A (zh) * | 2021-03-19 | 2021-06-18 | 中国平安人寿保险股份有限公司 | 一种数据预测模型的入模特征确定方法及设备 |
CN113159441A (zh) * | 2021-04-30 | 2021-07-23 | 中国银行股份有限公司 | 银行业务项目实施情况的预测方法及装置 |
CN113536672A (zh) * | 2021-07-09 | 2021-10-22 | 浙江网商银行股份有限公司 | 目标对象处理方法及装置 |
CN113610230A (zh) * | 2021-08-16 | 2021-11-05 | 中国工商银行股份有限公司 | 训练方法、预测方法、装置、计算机系统及存储介质 |
CN114926204A (zh) * | 2022-05-11 | 2022-08-19 | 北京大学 | 基于数据价值的数据处理装置及其方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423442A (zh) * | 2017-08-07 | 2017-12-01 | 火烈鸟网络(广州)股份有限公司 | 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备 |
CN107507042A (zh) * | 2017-09-15 | 2017-12-22 | 携程计算机技术(上海)有限公司 | 基于用户画像的营销方法及系统 |
CN108229525A (zh) * | 2017-05-31 | 2018-06-29 | 商汤集团有限公司 | 神经网络训练及图像处理方法、装置、电子设备和存储介质 |
CN108416669A (zh) * | 2018-03-13 | 2018-08-17 | 腾讯科技(深圳)有限公司 | 用户行为数据处理方法、装置、电子设备及计算机可读介质 |
CN108537397A (zh) * | 2017-03-01 | 2018-09-14 | 腾讯科技(深圳)有限公司 | 一种互联网征信评估方法和系统 |
CN108804689A (zh) * | 2018-06-14 | 2018-11-13 | 合肥工业大学 | 面向问答平台的融合用户隐连接关系的标签推荐方法 |
CN108921603A (zh) * | 2018-06-21 | 2018-11-30 | 中国农业银行股份有限公司 | 用户评价方法及相关装置 |
CN108960407A (zh) * | 2018-06-05 | 2018-12-07 | 出门问问信息科技有限公司 | 递归神经网路语言模型训练方法、装置、设备及介质 |
CN110110012A (zh) * | 2019-04-23 | 2019-08-09 | 上海淇玥信息技术有限公司 | 用户预期价值评估方法、装置、电子设备及可读介质 |
CN110163193A (zh) * | 2019-03-25 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机可读存储介质和计算机设备 |
-
2019
- 2019-11-11 CN CN201911092874.3A patent/CN111080338B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537397A (zh) * | 2017-03-01 | 2018-09-14 | 腾讯科技(深圳)有限公司 | 一种互联网征信评估方法和系统 |
CN108229525A (zh) * | 2017-05-31 | 2018-06-29 | 商汤集团有限公司 | 神经网络训练及图像处理方法、装置、电子设备和存储介质 |
CN107423442A (zh) * | 2017-08-07 | 2017-12-01 | 火烈鸟网络(广州)股份有限公司 | 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备 |
CN107507042A (zh) * | 2017-09-15 | 2017-12-22 | 携程计算机技术(上海)有限公司 | 基于用户画像的营销方法及系统 |
CN108416669A (zh) * | 2018-03-13 | 2018-08-17 | 腾讯科技(深圳)有限公司 | 用户行为数据处理方法、装置、电子设备及计算机可读介质 |
CN108960407A (zh) * | 2018-06-05 | 2018-12-07 | 出门问问信息科技有限公司 | 递归神经网路语言模型训练方法、装置、设备及介质 |
CN108804689A (zh) * | 2018-06-14 | 2018-11-13 | 合肥工业大学 | 面向问答平台的融合用户隐连接关系的标签推荐方法 |
CN108921603A (zh) * | 2018-06-21 | 2018-11-30 | 中国农业银行股份有限公司 | 用户评价方法及相关装置 |
CN110163193A (zh) * | 2019-03-25 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机可读存储介质和计算机设备 |
CN110110012A (zh) * | 2019-04-23 | 2019-08-09 | 上海淇玥信息技术有限公司 | 用户预期价值评估方法、装置、电子设备及可读介质 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639257A (zh) * | 2020-05-09 | 2020-09-08 | 北京三快在线科技有限公司 | 信息显示方法、装置、存储介质和电子设备 |
CN111681050A (zh) * | 2020-06-05 | 2020-09-18 | 深圳市卡牛科技有限公司 | 一种广告推送方法、装置、设备和存储介质 |
CN111681050B (zh) * | 2020-06-05 | 2023-08-29 | 深圳市卡牛科技有限公司 | 一种广告推送方法、装置、设备和存储介质 |
CN112215348A (zh) * | 2020-09-09 | 2021-01-12 | 广州小迈网络科技有限公司 | 广告投放信息处理方法 |
CN112163155A (zh) * | 2020-09-30 | 2021-01-01 | 深圳前海微众银行股份有限公司 | 信息处理方法、装置、设备及存储介质 |
CN112990583A (zh) * | 2021-03-19 | 2021-06-18 | 中国平安人寿保险股份有限公司 | 一种数据预测模型的入模特征确定方法及设备 |
CN112990583B (zh) * | 2021-03-19 | 2023-07-25 | 中国平安人寿保险股份有限公司 | 一种数据预测模型的入模特征确定方法及设备 |
CN113159441A (zh) * | 2021-04-30 | 2021-07-23 | 中国银行股份有限公司 | 银行业务项目实施情况的预测方法及装置 |
CN113536672A (zh) * | 2021-07-09 | 2021-10-22 | 浙江网商银行股份有限公司 | 目标对象处理方法及装置 |
CN113536672B (zh) * | 2021-07-09 | 2024-05-31 | 浙江网商银行股份有限公司 | 目标对象处理方法及装置 |
CN113610230A (zh) * | 2021-08-16 | 2021-11-05 | 中国工商银行股份有限公司 | 训练方法、预测方法、装置、计算机系统及存储介质 |
CN114926204A (zh) * | 2022-05-11 | 2022-08-19 | 北京大学 | 基于数据价值的数据处理装置及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111080338B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111080338B (zh) | 用户数据的处理方法、装置、电子设备及存储介质 | |
WO2020253775A1 (zh) | 机器学习建模过程的实现方法和系统 | |
Agarwal et al. | AI-powered decision making for the bank of the future | |
US20130238476A1 (en) | Counterfactual testing of finances using financial objects | |
Li et al. | Transfer learning-based default prediction model for consumer credit in China | |
Yang et al. | ENHANCING FINANCIAL SERVICES THROUGH BIG DATA AND AI-DRIVEN CUSTOMER INSIGHTS AND RISK ANALYSIS | |
CN111667307B (zh) | 一种理财产品销量的预测方法及装置 | |
CN112561681A (zh) | 确定潜在贷款企业的方法、装置、电子设备及存储介质 | |
US20150228019A1 (en) | System and method for facilitating social trading | |
Ways | and Machine Learning | |
Albareti et al. | A structured survey of quantum computing for the financial industry | |
Mahapatra et al. | Artificial intelligence and machine learning: discovering new ways of doing banking business | |
Mustafin et al. | Evaluation of the choice of borrower rating groups | |
Liu et al. | Financial big data management and intelligence based on computer intelligent algorithm | |
CN114846500A (zh) | 从动态生成的电子数据库中执行选择的系统 | |
Biswas et al. | Automated credit assessment framework using ETL process and machine learning | |
Mu et al. | Internet financial interest rate risk measure based on genetic rough set reduction | |
Theuri et al. | The impact of Artficial Intelligence and how it is shaping banking | |
CN116091242A (zh) | 推荐产品组合生成方法及装置、电子设备和存储介质 | |
US20130238477A1 (en) | System for dynamically generating financial objects | |
US20130238460A1 (en) | Determining shopping intent based on financial objects | |
Zand | Towards intelligent risk-based customer segmentation in banking | |
Wang et al. | Bank Customer Default Risk Based on Multimedia in the Background of Internet Digital Finance | |
US20200349642A1 (en) | Configuring user interface functionality based on background processing of data related to pre-qualification status | |
Ali et al. | An intelligent model for success prediction of initial coin offerings |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220928 Address after: 12 / F, 15 / F, 99 Yincheng Road, Pudong New Area pilot Free Trade Zone, Shanghai, 200120 Applicant after: Jianxin Financial Science and Technology Co.,Ltd. Address before: 25 Financial Street, Xicheng District, Beijing 100033 Applicant before: CHINA CONSTRUCTION BANK Corp. Applicant before: Jianxin Financial Science and Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |