CN116308642A

CN116308642A - 产品推荐方法、目标预测模型的创建方法、装置

Info

Publication number: CN116308642A
Application number: CN202310201222.9A
Authority: CN
Inventors: 陈芷君; 庞广龙; 刘垚; 刘国华
Original assignee: China Construction Bank Corp; CCB Finetech Co Ltd
Current assignee: China Construction Bank Corp; CCB Finetech Co Ltd
Priority date: 2023-03-01
Filing date: 2023-03-01
Publication date: 2023-06-23

Abstract

本公开涉及一种产品推荐方法、目标预测模型的创建方法、装置，涉及大数据数据处理技术领域。所述产品推荐方法包括：获取至少一个目标对象与推荐对象对应的数据信息；将所述数据信息输入至预先得到的目标预测模型中，利用所述目标预测模型输出所述目标对象对所述推荐对象的使用概率，根据所述使用概率和预设的产品推荐策略，确定目标推荐策略，所述预设的产品推荐策略中包括所述使用概率和推荐策略中的对应关系；利用所述目标推荐策略将所述推荐对象推荐给所述目标对象。采用本方法能够识别到对产品需求意图较为强烈的客户，并且使产品更好的推荐给客户，进而保证产品的销量。

Description

产品推荐方法、目标预测模型的创建方法、装置

技术领域

本公开涉及大数据数据处理技术领域，特别是涉及一种产品推荐方法、目标预测模型的创建方法、装置。

背景技术

随着消费水平的发展，近年来，越来越多的企业为了提高自己产品的销量，往往会根据用户的一些信息来识别到对其产品较为感兴趣的目标客户，进而对目标客户进行针对性的营销，以此来提高产品的效率。

然而，随着当前市场的竞争日益激烈，营销成本随着营销量级的增长而增加，并且针对同一企业，往往会针对同一用户进行多次营销，进而会使不少客户针对过度的营销进行反感，导致客户针对产品的需求欲望进一步降低。

因此，目前亟需一种能够通过用户的各种信息，识别到对产品需求意图较为强烈的客户，从而营销转化率，同时降低营销成本，使产品更好的推荐给客户，进而保证产品的销量的方法。

发明内容

基于此，有必要针对上述技术问题，提供一种能够识别到对产品需求意图较为强烈的客户，并且使产品更好的推荐给客户，进而保证产品的销量的产品推荐方法、目标预测模型的创建方法、装置。

第一方面，本公开提供了一种产品推荐方法。所述方法包括：

获取至少一个目标对象与推荐对象对应的数据信息；

将所述数据信息输入至预先得到的目标预测模型中，利用所述目标预测模型输出所述目标对象对所述推荐对象的使用概率，所述目标预测模型是利用目标证据权重、目标变量和逻辑回归模型进行模型拟合后得到的模型，所述目标证据权重是对所述推荐对象对应的数据信息进行特征处理后得到的，所述目标变量包括：所述数据信息变化后，所述目标对象是否继续使用所述推荐对象的条件变量；

根据所述使用概率和预设的产品推荐策略，确定目标推荐策略，所述预设的产品推荐策略中包括所述使用概率和推荐策略中的对应关系；

利用所述目标推荐策略将所述推荐对象推荐给所述目标对象。

在其中一个实施例中，所述目标预测模型的获取过程包括：

对所述推荐对象对应的数据信息进行特征处理后得到目标证据权重；

利用所述目标证据权重、所述目标变量和所述逻辑回归模型进行模型拟合，得到预测模型；

对所述预测模型进行模型验证，得到所述预测模型的验证指标，所述验证指标表征所述预测模型的预测能力，所述验证指标包括：KS值和/或感受性曲线；

响应于所述验证指标大于预设的阈值范围，确定所述预测模型为目标预测模型。

在其中一个实施例中，所述对所述推荐对象对应的数据信息进行特征处理后得到目标证据权重，包括：

至少根据所述推荐对象的类型，确定目标范围，所述目标范围中包括多个目标对象；

根据所述目标变量和所述目标范围，确定训练对象并获取所述训练对象对应的训练数据；所述训练数据中至少包括所述推荐对象对应的数据信息；

对所述训练数据进行特征处理，得到特征宽表，所述特征处理至少包括：数据清洗、预处理、特征衍生和特征预筛选；

对所述特征宽表进行分箱处理和目标特征筛选，得到目标证据权重，所述目标证据权重用于表征所述特征宽表中特征数据的差异程度。

在其中一个实施例中，所述特征预筛选的具体过程，包括下述中的一种或多种：

根据所述训练数据中的特征变量的非空占比，对所述训练数据的特征变量进行筛选；

根据所述训练数据中的特征变量的群体稳定性指标，对所述训练数据的特征变量进行筛选；

根据所述训练数据中的特征变量的信息值，对所述训练数据的特征变量进行筛选。

在其中一个实施例中，所述对所述特征宽表进行分箱处理和目标特征筛选，得到目标证据权重，包括：

对所述特征宽表中的每个特征数据进行分箱处理，得到多组特征数据，所述特征数据是根据所述特征变量得到的；

根据每组特征数据的证据权重和信息值，对所述多组特征数据进行目标特征筛选，得到目标特征数据，所述目标特征数据中包括至少一组特征数据；

获取所述目标特征数据的证据权重，得到目标证据权重。

在其中一个实施例中，所述目标对象包括：

在预设的时间范围内，所述推荐对象对应的数据信息变化的对象。

第二方面，本公开还提供了一种目标预测模型的创建方法，所述方法包括：

对推荐对象对应的数据信息进行特征处理后得到目标证据权重；

利用所述目标证据权重、目标变量和逻辑回归模型进行模型拟合，得到预测模型，所述目标变量包括：所述数据信息变化后，目标对象是否继续使用所述推荐对象的条件变量；

第三方面，本公开还提供了一种产品推荐装置。所述装置包括：

数据获取模块，用于获取至少一个目标对象与推荐对象对应的数据信息；

模型处理模块，用于将所述数据信息输入至预先得到的目标预测模型中，利用所述目标预测模型输出所述目标对象对所述推荐对象的使用概率，所述目标预测模型是利用目标证据权重、目标变量和逻辑回归模型进行模型拟合后得到的模型，所述目标证据权重是对所述推荐对象对应的数据信息进行特征处理后得到的，所述目标变量包括：所述数据信息变化后，所述目标对象是否继续使用所述推荐对象的条件变量；

策略确定模块，用于根据所述使用概率和预设的产品推荐策略，确定目标推荐策略，所述预设的产品推荐策略中包括所述使用概率和推荐策略中的对应关系；

产品推荐模块，用于利用所述目标推荐策略将所述推荐对象推荐给所述目标对象。

在所述装置的其中一个实施例中，所述装置还包括：

特征处理模块，用于对所述推荐对象对应的数据信息进行特征处理后得到目标证据权重；

模型拟合模块，用于利用所述目标证据权重、所述目标变量和所述逻辑回归模型进行模型拟合，得到预测模型；

模型验证模块，用于对所述预测模型进行模型验证，得到所述预测模型的验证指标，所述验证指标表征所述预测模型的预测能力，所述验证指标包括：KS值和/或感受性曲线；

模型确定模块，用于响应于所述验证指标大于预设的阈值范围，确定所述预测模型为目标预测模型。

在所述装置的其中一个实施例中，所述特征处理模块，包括：

目标范围确定模块，用于至少根据所述推荐对象的类型，确定目标范围，所述目标范围中包括多个目标对象；

训练数据获取模块，用于根据所述目标变量和所述目标范围，确定训练对象并获取所述训练对象对应的训练数据；所述训练数据中至少包括所述推荐对象对应的数据信息；

特征处理子模块，用于对所述训练数据进行特征处理，得到特征宽表，所述特征处理至少包括：数据清洗、预处理、特征衍生和特征预筛选；

目标特征筛选模块，用于对所述特征宽表进行分箱处理和目标特征筛选，得到目标证据权重，所述目标证据权重用于表征所述特征宽表中特征数据的差异程度。

在所述装置的其中一个实施例中，所述特征子处理模块，还包括：第一筛选模块，用于根据所述训练数据中的特征变量的非空占比，对所述训练数据的特征变量进行筛选；

第二筛选模块，用于根据所述训练数据中的特征变量的群体稳定性指标，对所述训练数据的特征变量进行筛选；

第三筛选模块，用于根据所述训练数据中的特征变量的信息值，对所述训练数据的特征变量进行筛选。

在所述装置的其中一个实施例中，所述目标特征筛选模块，包括：

分箱处理模块，用于对所述特征宽表中的每个特征数据进行分箱处理，得到多组特征数据，所述特征数据是根据所述特征变量得到的；

目标筛选模块，用于根据每组特征数据的证据权重和信息值，对所述多组特征数据进行目标特征筛选，得到目标特征数据，所述目标特征数据中包括至少一组特征数据；

目标证据权重确定模块，用于获取所述目标特征数据的证据权重，得到目标证据权重。

第四方面，本公开还提供了一种目标预测模型的创建装置，所述装置包括：

数据信息处理模块，用于对推荐对象对应的数据信息进行特征处理后得到目标证据权重；

预测模型拟合模块，用于利用所述目标证据权重、目标变量和逻辑回归模型进行模型拟合，得到预测模型，所述目标变量包括：所述数据信息变化后，目标对象是否继续使用所述推荐对象的条件变量；

预测模型验证模块，用于对所述预测模型进行模型验证，得到所述预测模型的验证指标，所述验证指标表征所述预测模型的预测能力，所述验证指标包括：KS值和/或感受性曲线；

目标预测模型确定模块，用于响应于所述验证指标大于预设的阈值范围，确定所述预测模型为目标预测模型。

第五方面，本公开还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一方法实施例中的步骤。

第六方面，本公开还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一方法实施例中的步骤。

第七方面，本公开还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述任一方法实施例中的步骤。

上述各实施例中，获取目标对象与推荐对象对应的数据信息，能够使用与推荐对象相关信息作为输出数据。并将数据信息输入至预先得到的目标预测模型中，利用所述目标预测模型输出所述目标对象对所述推荐对象的使用概率。另外，目标预测模型也是根据推荐对象对应的数据进行特征处理得到的，并且目标预测模型的目标变量为数据信息变化后，所述目标对象是否继续使用所述推荐对象的条件变量。因此，可以根据不同的数据信息，并利用目标预测模型能够准确的确定使用概率。另外，因为目标预测模型是通过逻辑回归模型训练得到，该算法可解释性强，并且逻辑回归模型的训练速度较快，能够提高模型训练的速度，另外，利用目标证据权重能够确定不同特征对最终结果的影响，进一步的提高了使用概率确定的准确性。并且本案中由于使用目标预测模型进行自动化的处理，能够降低成本。另外，根据所述使用概率和预设的产品推荐策略，确定目标推荐策略，利用所述目标推荐策略将所述推荐对象推荐给所述目标对象。能够针对性的根据使用概率使用不同的方式将推荐对象推荐给目标对象，可以提高转化率，进而保证产品的销量。

附图说明

为了更清楚地说明本公开具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为一个实施例中产品推荐方法的应用环境示意图；

图2为一个实施例中产品推荐方法的流程示意图；

图3为一个实施例中目标预测模型的获取过程的流程示意图；

图4为一个实施例中S302步骤的流程示意图；

图5为一个实施例中特征筛选的具体过程的流程示意图；

图6为一个实施例中S408步骤的流程示意图；

图7为另一个实施例中产品推荐方法的流程示意图；

图8为一个实施例中产品推荐装置的结构示意框图；

图9为一个实施例中目标预测模型的创建装置的结构示意框图；

图10为一个实施例中计算机设备的内部结构示意图。

具体实施方式

为了使本公开的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本公开进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本公开，并不用于限定本公开。

需要说明的是，本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中，术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系。例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

正如背景技术所述，传统技术中的数字化营销，通常是采用对数据挖掘对用户搭建以用户为中心的画像体系，对用户的多方面信息进行深入解析，并建立客户标签。工作人员可以将不同的标签进行组合，进而形成不同的目标群体，进而对用户进行区分。虽然通过客户标签可以识别出客户的一些相关属性，然而缺乏对用户的各种意向的分析，未对客户对产品的响应程度进行预测，并且产品的营销和推荐效果依赖工作人员对客户标签的理解，仍然不能够针对性的对提高产品的推销和销售之间的转化率，以及降低营销成本。

因此，为解决上述问题，本公开实施例提供了一种产品推荐方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上，也可以放在云上或其他网络服务器上。终端102可以从服务器104中获取至少一个目标对象与推荐对象对应的数据信息。终端102可以将所述数据信息输入至终端102或者服务器104预先得到的目标预测模型中，终端102利用目标预测模型输出所述目标对象对所述推荐对象的使用概率。其中，所述目标预测模型是终端102或者服务器104利用目标证据权重、目标变量和逻辑回归模型进行模型拟合后得到的模型。所述目标证据权重是终端102或者服务器104对推荐对象对应的数据信息进行特征处理后得到的。目标变量包括：所述数据信息变化后，所述目标对象是否继续使用所述推荐对象的条件变量。终端102根据所述使用概率和预设的产品推荐策略，确定目标推荐策略。所述预设的产品推荐策略中包括使用概率和推荐策略的对应的关系。终端102可以利用目标推荐策略将所述推荐对象推荐给所述目标对象。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备等，物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种产品推荐方法，以该方法应用于图1中的终端102为例进行说明，包括以下步骤：

S202，获取至少一个目标对象与推荐对象对应的数据信息。

其中，目标对象通常可以是需要进行营销或者需要进行推销的对象。推荐对象通常可以是需要进行营销或者推销的产品，在不同的领域其对应的产品也不相同。在金融领域，该推荐对象可以是银行的个人消费贷款产品、理财产品等，或者保险机构的个人保险产品。在商品领域，该推荐对象可以是需要销售的商品，如家用电器等。数据信息通常可以是与推荐对象对应的信息，例如推荐对象为个人消费贷款产品，则该数据信息可以是行内贷款、信用卡账单、消费贷款测额行为、预授信额度等方面的数据，如推荐对象为家用电器(如冰箱)，则该数据信息可以是目标对象的购买的食品信息、消费的食品金额的信息、购买食品的频率信息等等。根据不同的推荐对象，其对应的数据信息也不同，在本公开的一些实施例不对推荐对象对应的数据信息进行绝对的限制。另外，目标对象可以是在预设的时间范围内，推荐对象对应的数据信息变化的对象。通过该种方式来确定目标对象，能够确定使用推荐对象的潜在客户。若数据信息未发生变化，则对该对象的营销概率较低，因此通过推荐对象对应的数据信息变化来确定目标对象能够增加产品推销成功的成功率。另外，通常情况下，目标对象为非使用所述推荐对象的对象。例如推荐对象为个人消费贷款产品，则目标对象可以是有预授信额度、符合基本的准入规则且非个人消费贷在贷的客户。

在一些示例性的实施例中，若推荐对象为个人消费贷款产品，则目标对象可以是在一定的时间内，预授信额度上升的对象或者客户。若推荐对象为保险产品，则目标对象可以是在一定的时间内，看病次数提升的对象或者客户。可以理解的是，上述仅用于举例说明。根据不同的推荐对象的数据信息，本领域技术人员可以灵活的来确定目标对象。

具体地，可以先确定需要推销或者营销的推荐对象。进而在多个对象中选择目标对象，并获取该目标对象与推荐对象对应的数据信息。

S204，将所述数据信息输入至预先得到的目标预测模型中，利用所述目标预测模型输出所述目标对象对所述推荐对象的使用概率，所述目标预测模型是利用目标证据权重、目标变量和逻辑回归模型进行模型拟合后得到的模型，所述目标证据权重是对所述推荐对象对应的数据信息进行特征处理后得到的，所述目标变量包括：所述数据信息变化后，所述目标对象是否继续使用所述推荐对象的条件变量。

其中，逻辑回归(Logistic Regression)是一种用于解决二分类问题的机器学习方法，逻辑回归模型可以是使用逻辑回归方法的模型。逻辑回归模型通常是一种用于解决二分类问题的机器学习方法，使用线性回归模型的预测值逼近分类任务实际标签的对数几率，原理是用sigmoid函数把线性回归的结果(-∞，∞)映射到(0，1)。使用概率通常可以是目标对象使用或者购买推荐对象的概率。例如推荐对象为个人消费贷款产品，则使用概率可以是目标对象申请个人消费贷款产品的概率。例如推荐对象为家用电器，则使用概率可以是目标对象购买该家用电器的概率。特征处理通常可以是特征工程的处理方式。特征工程，通常是指用一系列工程化的方式从原始数据中筛选出更好的数据特征，以提升模型的训练效果。目标证据权重通常可以是WOE(Weight of Evidence)，用来表示特征数据的差异程度。目标变量通常可以是在推荐对象的数据信息变化后，目标对象是否还能够继续使用推荐对象的条件变量。继续以推荐对象为个人消费贷款产品为例，则目标变量可以是在一定时间周期内，预授信额度上升的目标对象是否有申请个人消费贷款产品的条件。模型拟合通常可以是模型训练的一种方式。

具体地，可以对推荐对象对应的数据信息进行特征处理，得到目标证据权重。然后利用目标证据权重、目标变量以及逻辑回归模型进行模型训练，训练完成后得到目标预测模型。然后可以将获取到的数据信息输入至目标预测模型中，因为目标预测模型为逻辑回归模块训练得到，可以直接利用目标预测模型输出目标对象对推荐对象的使用概率。

S206，根据所述使用概率和预设的产品推荐策略，确定目标推荐策略，所述预设的产品推荐策略中包括所述使用概率和推荐策略中的对应关系。

其中，对应关系可以是使用概率和推荐策略的映射关系，也可以是一一对应的关系。例如，使用概率为30％，则对应的推荐策略可以是使用短信通知的方式进行推荐。若使用概率为70％，则对应的推荐策略可以是使用电话通知的方式进行推荐。

具体地，可以利用确定的使用概率在预设的产品推荐策略中进行匹配，得到与使用概率相对应的推荐策略，该推荐策略可以是目标推荐策略。

S208，利用所述目标推荐策略将所述推荐对象推荐给所述目标对象。

具体地，因为匹配到了对应的目标推荐策略，因此可以使用目标推荐策略将推荐对象推荐给目标对象。

在一些示例性的实施例中，可以对使用概率较高的客户进行电话营销，对使用概率较低的客户进行短信、邮件营销，进而提高营销效率及转化率。

上述产品推荐方法中，获取目标对象与推荐对象对应的数据信息，能够使用与推荐对象相关信息作为输出数据。并将数据信息输入至预先得到的目标预测模型中，利用所述目标预测模型输出所述目标对象对所述推荐对象的使用概率。另外，目标预测模型也是根据推荐对象对应的数据进行特征处理得到的，并且目标预测模型的目标变量为数据信息变化后，所述目标对象是否继续使用所述推荐对象的条件变量。因此，可以根据不同的数据信息，并利用目标预测模型能够准确的确定使用概率。另外，因为目标预测模型是通过逻辑回归模型训练得到，该算法可解释性强，并且逻辑回归模型的训练速度较快，能够提高模型训练的速度，另外，利用目标证据权重能够确定不同特征对最终结果的影响，进一步的提高了使用概率确定的准确性。并且本案中由于使用目标预测模型进行自动化的处理，能够降低成本。另外，根据所述使用概率和预设的产品推荐策略，确定目标推荐策略，利用所述目标推荐策略将所述推荐对象推荐给所述目标对象。能够针对性的根据使用概率使用不同的方式将推荐对象推荐给目标对象，可以提高转化率，进而保证产品的销量。

在一个实施例中，如图3所示，所述目标预测模型的获取过程包括：

S302，对所述推荐对象对应的数据信息进行特征处理后得到目标证据权重。

S304，利用所述目标证据权重、所述目标变量和所述逻辑回归模型进行模型拟合，得到预测模型。

具体地，可以获取推荐对象对应的数据信息，该数据信息可以是目标对象与推荐对象对应的数据，也可以仅为推荐对象对应的数据信息。将该数据信息进行特征工程的处理方式，得到目标证据权重。然后利用目标证据权重、目标变量和逻辑回归模型进行模型拟合，得到预测模型。

S306，对所述预测模型进行模型验证，得到所述预测模型的验证指标，所述验证指标表征所述预测模型的预测能力，所述验证指标包括：KS值和/或感受性曲线。

其中，KS(Kolmogorov-Smirnov Value)可以用来反映当前预测模型的最大区分能力，用于判断模型的有效性。感受性曲线可以是ROC曲线，用以衡量预测模型整体的区分度。

具体地，可以使用交叉验证方法，对预测模型进行模型验证，并可以绘制ROC曲线、计算精确率和召回率或者计算KS值等指标来评估模型性能。

在一些示例性的实施例中，模型验证一般情况下可以使用验证样本及时间外的验证样本来运行预测模型，并看预测模型对应的KS值、ROC曲线评估看是否与训练预测模型时所使用的训练杨蓓得到的KS值和ROC曲线之间跑出的差异大不大。

可以理解的是，在本公开的一些实施例中，还可以采用其他的模型验证方式对模型进行验证，在本公开的一些实施例中，不对模型验证方式进行绝对的限制。

S308，判断所述验证指标是否大于预设的阈值范围。

S310，响应于所述验证指标大于预设的阈值范围，确定所述预测模型为目标预测模型。

S312，响应于所述验证指标未大于预设的阈值范围，确定所述预测模型未通过验证，回到S302步骤。

其中，预设的阈值范围可以实际情况来进行设置，例如验证指标为KS值，则预设的阈值范围可以是进行模型训练时，训练样本利用预测模型的得到的KS值，并且在KS值上下浮动一定区间的范围。

具体地，上述利用模型验证方式得到模型的KS值和/或ROC曲线后，可以根据预设的阈值范围进行比较，若大于预设的阈值范围，则通常情况下可以证明该预测模型的训练效果较好，使用该预测模型可以达到较好的预测效果，因此该预测模型可以为目标预测模型。若不大于预设的阈值范围，则该预测模型的预测效果较差，回到S302步骤进行重新训练。

在一些示例性的实施例中，若利用KS进行确定预测模型是否为目标预测模型，则KS值通常情况下需要在0.3以上才可以，KS值在0.5-0.6之间，可以确定预测模型的预测效果较好。

本实施例中，通过验证指标对预测模型进行验证，以此来确定目标预测模型，能够在预测模型中找到预测效果较好的预测模型作为目标预测模型，能够提高确定使用概率的准确性。

在一个实施例中，如图4所示，所述对所述推荐对象对应的数据信息进行特征处理后得到目标证据权重，包括：

S402，至少根据所述推荐对象的类型，确定目标范围，所述目标范围中包括多个目标对象。

其中，推荐对象的类型金融产品类型、商业产品类型或者其他能够进行销售、申请或者使用的产品的类型。目标范围通常可以是需要使用，或者说对推荐对象有使用意向的客户范围。

具体的，可以仅根据推荐对象的类型，来确定目标客户范围。例如，推荐对象为个人消费贷款产品，则目标客户范围可以是需要进行贷款或者有贷款需求的客户。

在另一些示例性的实施例中，还可以业务需求、应用场景、数据可获得性以及推荐对象的类型来综合的确定目标范围，从而准确的确定目标对象，并且能够方便的获取目标对象对应的各种数据。

S404，根据所述目标变量和所述目标范围，确定训练对象并获取所述训练对象对应的训练数据；所述训练数据中至少包括所述推荐对象对应的数据信息。

其中，训练对象可以是在一定时间内，数据信息变化的目标对象。

具体地，确定目标变量之后，可以根据目标变量在目标范围中进行筛选，确定目标范围中训练对象。然后获取该训练对象对应的训练数据。

在一些示例性的实施例中，继续以个人消费贷款产品为例，则目标变量可以是在一定时间周期内，预授信额度上升的目标对象是否有申请个人消费贷款产品的条件。因此在目标范围内，可以找到授信额度上升的目标对象，该目标对象可以为训练对象。然后获取训练对象的预授信额度变化、客户行内贷款、信用卡账单等数据。可以理解的是，上述仅以个人消费贷款产品为例进行举例说明，根据不同的推荐对象，其对应的目标范围、目标变量和训练对象均不相同，本领域技术人员可以灵活的来确定。

S406，对所述训练数据进行特征处理，得到特征宽表，所述特征处理至少包括：数据清洗、预处理、特征衍生和特征预筛选。

其中，数据清洗(Data cleaning)可是对训练数据进行重新审查和校验的过程，目的在于删除重复信息、纠正存在的错误，并提供数据一致性。数据预处理(datapreprocessing)可以是在特征衍生以前对训练数据进行的一些处理，在本公开的一些实施例中不对预处理的具体方式进行绝对限制。特征衍生可以是用训练数据进行特征学习得到新的特征的方式，新生成的特征通常情况下与训练数据中的特征存在相关性，即新生成的特征通常情况下具有一定的业务含义。特征预筛选通常可以是对特征衍生出的特征和训练数据中存在的特征进行筛选的方式，剔除无效特征，筛选有效特征，从而提高模型训练效率与训练结果。

具体地，可以对训练数据通过数据清洗、预处理、特征衍生、特征预筛选等步骤形成特征宽表。特征宽表中存在多个特征数据，每个特征数据都是通过训练数据的特征变量得到的。

S408，对所述特征宽表进行分箱处理和目标特征筛选，得到目标证据权重，所述目标证据权重用于表征所述特征宽表中特征数据的差异程度。

其中，分箱处理通常可以是将特征宽表中的特征数据进行分组的方式。目标特征筛选通常可以是对上述特征宽表中的特征数据进行二次筛选的方式，以更准确的得到更加有效的特征。

具体地，可以对特征宽表进行分箱处理，在分箱处理的基础上，基于证据权重和IV值进行目标特征筛选。如果证据权重的绝对值越大，这种则分箱后各个特征之间的差异就越明显，绝对值越小就表明差异不明显。如果证据权重为0，则说明该分箱中预测效果好的特征和预测效果不好特征的比例等于随机比值，此时这个分箱就无预测能力。另外，信息值是预测模型中选择重要变量的方式之一，它能根据预测变量的重要性对预测变量进行排序。因此，可以用证据权重和信息值对特征宽表中的特征数据进行筛选，进而得到目标证据权重。

在一些示例性的实施例中，若推荐对象为个人消费贷款产品，则对应的特征可以如表1特征示例表所示。

表1特征示例表

可以理解的是，上述表1仅用于举例说明。

在本实施例中，利用目标变量在目标范围内进行筛选，能够得到训练对象，而训练对象可以是在一定时间内，数据信息变化的目标对象，因此利用训练对应的训练数据进行特征处理，能够得到较为准确的特征，能够提高模型训练时的准确性。

在一个实施例中，如图5所示，所述特征筛选的具体过程包括下述中的一种或多种：

S502，根据所述训练数据中的特征变量的非空占比，对所述训练数据的特征变量进行筛选。

S504，根据所述训练数据中的特征变量的群体稳定性指标，对所述训练数据的特征变量进行筛选。

S506，根据所述训练数据中的特征变量的信息值，对所述训练数据的特征变量进行筛选。

其中，群体稳定性指标可以是PSI(Population Stability Index)，用以计算不同数据集上的分布差异的指标。分为模型PSI和单变量PSI，本公开中用于可以使用单变量PSI，用以衡量特征的稳定性，当PSI大于0.02时考虑剔除特征。信息值可以是IV(Information Value)值，即信息价值，用以衡量变量(特征)对目标事件的单一预测能力。非空占比通常可以是某种特征变量中空值和该种特征变量的比值，例如特征变量为A共有10个，其中3个为空值，则非空占比可以为70％。

具体地，可以确定训练数据中多种类型的特征变量，进而进行计算每种类型的特征变量的非空占比，可以将非空占比和预先设置的占比阈值进行比较。若非空占比小于预先设置的占比阈值，则可以确定该种类型的特征变量其中的空值较多，需要删除该种类型的特征变量。在一些示例性的实施例中，例如非空占比超过30％，则需要考虑删除该种类型的特征变量。还可以计算训练数据中每个特征变量的群体稳定性指标，将每个特征变量的群体稳定性指标和预先设置的指标阈值进行比较，若大于预先设置的指标阈值，则可以确定该特征变量不稳定，进行删除。通常情况下，指标阈值可以为0.02。还可以计算每个特征变量的信息值，将每个特征变量的信息值和预先设置信息阈值进行比较，若信息值小于信息阈值，则表明该特征变量的预测能力较差，删除该特征变量。

在本实施例中，通过对训练数据的特征变量进行筛选，能够得到对模型训练时有用的特征变量，可以提高模型预测结果的准确性。

在一个实施例中，如图6所示，所述对所述特征宽表进行分箱处理和目标特征筛选，得到目标证据权重，包括：

S602，对所述特征宽表中的每个特征数据进行分箱处理，得到多组特征数据，所述特征数据是根据所述特征变量得到的。

S604，根据每组特征数据的证据权重和信息值，对所述多组特征数据进行目标特征筛选，得到目标特征数据，所述目标特征数据中包括至少一组特征数据。

S606，获取所述目标特征数据的证据权重，得到目标证据权重。

其中，特征数据中至少可以包括特征变量，还可以包括其他数据，例如编码、或者特征变量的名称等等其他信息。

具体地，可以将特征宽表中的每个特征数据分箱处理，分箱处理后可以得到多组特征数据。每组特征数据中可以包括多个特征数据。进而后续对每组特征数据的预测效果进行判断。可以计算每组特征数据的WOE值，计算WOE值之后可以计算IV值，然后利用WOE值和IV值对每组特征数据进行筛选，筛选后得到目标特征数据。目标特征数据可以由一组或者多组特征数据构成。然后获取该目标特征数据的WOE值，得到目标证据权重。

在本实施例中，通过利用WOE值和IV值进行二次筛选，能够缩小进行训练时所使用的特征数据的范围，提高预测模型的预测精度，以及提高训练预测模型时的训练效果。

在一个实施例中，本公开还提供了一种目标预测模型的创建方法，所述方法包括：

关于本实施例中的具体实施方式和限定可参见上述实施例，在此不进行重复赘述。

在一个实施例中，本公开还提供了另一种产品推荐方法，如图7所示，所述方法包括：

S702，至少根据所述推荐对象的类型，确定目标范围，所述目标范围中包括多个目标对象。

S704，根据所述目标变量和所述目标范围，确定训练对象并获取所述训练对象对应的训练数据；所述训练数据中至少包括所述推荐对象对应的数据信息。

S706，对所述训练数据进行特征处理，得到特征宽表，所述特征处理至少包括：数据清洗、预处理、特征衍生和特征预筛选。

S708，根据所述训练数据中的特征变量的非空占比，对所述训练数据的特征变量进行筛选。

S710，根据所述训练数据中的特征变量的群体稳定性指标，对所述训练数据的特征变量进行筛选。

S712，根据所述训练数据中的特征变量的信息值，对所述训练数据的特征变量进行筛选。

S714，对所述特征宽表中的每个特征数据进行分箱处理，得到多组特征数据，所述特征数据是根据所述特征变量得到的。

S716，根据每组特征数据的证据权重和信息值，对所述多组特征数据进行目标特征筛选，得到目标特征数据，所述目标特征数据中包括至少一组特征数据。

S718，获取所述目标特征数据的证据权重，得到目标证据权重，所述目标证据权重用于表征所述特征宽表中特征数据的差异程度。

S720，利用所述目标证据权重、目标变量和逻辑回归模型进行模型拟合，得到预测模型，所述目标变量包括：所述数据信息变化后，目标对象是否继续使用所述推荐对象的条件变量。

S722，对所述预测模型进行模型验证，得到所述预测模型的验证指标，所述验证指标表征所述预测模型的预测能力，所述验证指标包括：KS值和/或感受性曲线。

S724，响应于所述验证指标大于预设的阈值范围，确定所述预测模型为目标预测模型。

S726，获取至少一个目标对象与推荐对象对应的数据信息。

S728，将所述数据信息输入至预先得到的目标预测模型中，利用所述目标预测模型输出使用概率。

S730，根据所述使用概率和预设的产品推荐策略，确定目标推荐策略，所述预设的产品推荐策略中包括所述使用概率和推荐策略中的对应关系。

S732，利用所述目标推荐策略将所述推荐对象推荐给所述目标对象。

应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本公开实施例还提供了一种用于实现上述所涉及的产品推荐方法的产品推荐装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个产品推荐装置实施例中的具体限定可以参见上文中对于产品推荐方法的限定，在此不再赘述。

在一个实施例中，如图8所示，提供了一种产品推荐装置800，包括：数据获取模块802、模型处理模块804、策略确定模块806和产品推荐模块808，其中：

数据获取模块802，用于获取至少一个目标对象与推荐对象对应的数据信息；

模型处理模块804，用于将所述数据信息输入至预先得到的目标预测模型中，利用所述目标预测模型输出所述目标对象对所述推荐对象的使用概率，所述目标预测模型是利用目标证据权重、目标变量和逻辑回归模型进行模型拟合后得到的模型，所述目标证据权重是对所述推荐对象对应的数据信息进行特征处理后得到的，所述目标变量包括：所述数据信息变化后，所述目标对象是否继续使用所述推荐对象的条件变量；

策略确定模块806，用于根据所述使用概率和预设的产品推荐策略，确定目标推荐策略，所述预设的产品推荐策略中包括所述使用概率和推荐策略中的对应关系；

产品推荐模块808，用于利用所述目标推荐策略将所述推荐对象推荐给所述目标对象。

在所述装置的一个实施例中，所述装置还包括：

在所述装置的一个实施例中，所述特征处理模块，包括：

在所述装置的一个实施例中，所述特征子处理模块，还包括：第一筛选模块，用于根据所述训练数据中的特征变量的非空占比，对所述训练数据的特征变量进行筛选；

在所述装置的一个实施例中，所述目标特征筛选模块，包括：

在所述装置的一个实施例中，所述目标对象包括：

上述产品推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，如图9所示，本公开实施例还提供了一种目标预测模型的创建装置900，所述装置包括：

数据信息处理模块902，用于对所述推荐对象对应的数据信息进行特征处理后得到目标证据权重；

预测模型拟合模块904，用于利用所述目标证据权重、目标变量和逻辑回归模型进行模型拟合，得到预测模型，所述目标变量包括：所述数据信息变化后，目标对象是否继续使用所述推荐对象的条件变量；

预测模型验证模块906，用于对所述预测模型进行模型验证，得到所述预测模型的验证指标，所述验证指标表征所述预测模型的预测能力，所述验证指标包括：KS值和/或感受性曲线；

目标预测模型确定模块908，用于响应于所述验证指标大于预设的阈值范围，确定所述预测模型为目标预测模型。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据信息、产品推荐策略等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种产品推荐方法。

本领域技术人员可以理解，图10中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述任一方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述任一方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述任一方法实施例中的步骤。

需要说明的是，本公开所涉及的信息(包括但不限于推荐对象对应的数据信息、训练对象的训练数据等)，均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本公开所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory，MRAM)、铁电存储器(Ferroelectric Random Access Memory，FRAM)、相变存储器(Phase Change Memory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory，DRAM)等。本公开所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本公开所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本公开的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本公开专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本公开构思的前提下，还可以做出若干变形和改进，这些都属于本公开的保护范围。因此，本公开的保护范围应以所附权利要求为准。

Claims

1.一种产品推荐方法，其特征在于，所述方法包括：

获取至少一个目标对象与推荐对象对应的数据信息；

2.根据权利要求1所述的方法，其特征在于，所述目标预测模型的获取过程包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述推荐对象对应的数据信息进行特征处理后得到目标证据权重，包括：

4.根据权利要求3所述的方法，其特征在于，所述特征预筛选的具体过程，包括下述中的一种或多种：

5.根据权利要求4所述的方法，其特征在于，所述对所述特征宽表进行分箱处理和目标特征筛选，得到目标证据权重，包括：

获取所述目标特征数据的证据权重，得到目标证据权重。

6.根据权利要求1至5中任意一项所述的方法，其特征在于，所述目标对象包括：

7.一种目标预测模型的创建方法，其特征在于，所述方法包括：

8.一种产品推荐装置，其特征在于，所述装置包括：

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

10.根据权利要求9所述的装置，其特征在于，所述特征处理模块，包括：

11.根据权利要求10所述的装置，其特征在于，所述特征子处理模块，还包括：第一筛选模块，用于根据所述训练数据中的特征变量的非空占比，对所述训练数据的特征变量进行筛选；

12.根据权利要求10所述的装置，其特征在于，所述目标特征筛选模块，包括：

13.一种目标预测模型的创建装置，其特征在于，所述装置包括：

14.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项或权利要求7所述的方法的步骤。

15.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项或权利要求7所述的方法的步骤。

16.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至6中任一项或权利要求7所述的方法的步骤。