CN117314586A

CN117314586A - 产品推荐方法、装置、计算机设备及存储介质

Info

Publication number: CN117314586A
Application number: CN202311421232.XA
Authority: CN
Inventors: 严杨扬
Original assignee: Ping An Property and Casualty Insurance Company of China Ltd
Current assignee: Ping An Property and Casualty Insurance Company of China Ltd
Priority date: 2023-10-27
Filing date: 2023-10-27
Publication date: 2023-12-29

Abstract

本申请实施例属于人工智能和金融科技领域，涉及一种产品推荐方法、装置、计算机设备及存储介质，方法包括：获取已购买第一产品的各样本客户的训练样本，训练样本带有样本客户对第二产品购买情况的购买标签；根据购买标签生成各训练样本的状态标签和产品标签；根据带有状态标签的各训练样本训练得到第一预测模型；根据带有产品标签的各训练样本训练得到第二预测模型；获取目标客户的客户样本并输入第一预测模型，得到第一预测结果；当第一预测结果表明目标客户为产品组合倾向客户时，将客户样本输入第二预测模型得到第二预测结果；根据第一产品和第二预测结果确定产品组合并进行产品推荐，提高了新类型产品在产品推荐时的准确性。

Description

产品推荐方法、装置、计算机设备及存储介质

技术领域

本申请涉及人工智能和金融科技领域，尤其涉及一种产品推荐方法、装置、计算机设备及存储介质。

背景技术

在生产经营活动中，为客户进行产品推荐已经越发常见。随着机构业务的变化，机构可能需要推出新类型的产品，并将新类型的产品推荐给客户。举例说明，在金融保险领域，保险公司等金融保险机构会推出新类型的保险产品。比如，某个保险公司主要经营车辆险，随着保险政策的变化，车辆险的利润降低，保险公司需要经营非车辆险，并推出了新的驾乘险、工程险、责任险等新类型的保险产品。然而，对机构来说，新类型的产品属于新兴业务，如何从已有的大量客户中筛选出可能购买新类型产品的客户是非常重要的。由于缺少新类型产品的数据，往往通过人工经验进行新类型产品的推荐，这使得产品推荐的准确性较低。

发明内容

本申请实施例的目的在于提出一种产品推荐方法、装置、计算机设备及存储介质，以解决新类型产品在产品推荐时准确性较低的问题。

为了解决上述技术问题，本申请实施例提供一种产品推荐方法，采用了如下所述的技术方案：

获取多个样本客户的训练样本，各样本客户为第一产品的购买客户，训练样本带有样本客户对第二产品购买情况的购买标签；

根据各训练样本的购买标签，生成所述各训练样本的状态标签和产品标签；

根据带有状态标签的所述各训练样本训练第一初始预测模型，得到第一预测模型；

根据带有产品标签的所述各训练样本训练第二初始预测模型，得到第二预测模型；

获取目标客户的客户样本，并将所述客户样本输入所述第一预测模型，得到第一预测结果；

当所述第一预测结果表明所述目标客户为产品组合倾向客户时，将所述客户样本输入所述第二预测模型，得到第二预测结果；

根据所述第一产品和所述第二预测结果确定产品组合，并根据所述产品组合向所述目标客户进行产品推荐。

为了解决上述技术问题，本申请实施例还提供一种产品推荐装置，采用了如下所述的技术方案：

训练获取模块，用于获取多个样本客户的训练样本，各样本客户为第一产品的购买客户，训练样本带有样本客户对第二产品购买情况的购买标签；

标签生成模块，用于根据各训练样本的购买标签，生成所述各训练样本的状态标签和产品标签；

第一训练模块，用于根据带有状态标签的所述各训练样本训练第一初始预测模型，得到第一预测模型；

第二训练模块，用于根据带有产品标签的所述各训练样本训练第二初始预测模型，得到第二预测模型；

第一预测模块，用于获取目标客户的客户样本，并将所述客户样本输入所述第一预测模型，得到第一预测结果；

第二预测模块，用于当所述第一预测结果表明所述目标客户为产品组合倾向客户时，将所述客户样本输入所述第二预测模型，得到第二预测结果；

组合推荐模块，用于根据所述第一产品和所述第二预测结果确定产品组合，并根据所述产品组合向所述目标客户进行产品推荐。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：

与现有技术相比，本申请实施例主要有以下有益效果：获取多个样本客户的训练样本，各样本客户为第一产品的购买客户，训练样本带有样本客户对第二产品购买情况的购买标签；根据购买标签生成各训练样本的状态标签和产品标签，状态标签表示样本客户是否购买了第二产品，产品标签表示样本客户具体购买过哪种第二产品；根据带有状态标签的各训练样本训练第一初始预测模型，得到第一预测模型，并根据带有产品标签的各训练样本训练第二初始预测模型，得到第二预测模型；获取目标客户的客户样本并输入第一预测模型，得到第一预测结果；第一预测结果表示目标客户是否愿意购买第二产品，由于目标客户也是第一产品的已有客户，当目标客户愿意购买第二产品时，表示目标客户为产品组合倾向客户时；将客户样本输入第二预测模型，得到第二预测结果，第二预测结果包含目标客户购买每种第二产品的概率；根据第一产品和第二预测结果可以生成具有较高转化概率产品组合，根据产品组合向目标客户进行产品推荐，确保了具有较高增益，更提高了新类型产品在产品推荐中的准确性和转化率。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图；

图2是根据本申请的产品推荐方法的一个实施例的流程图；

图3是根据本申请的产品推荐装置的一个实施例的结构示意图；

图4是根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的产品推荐方法一般由服务器执行，相应地，产品推荐装置一般设置于服务器中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的产品推荐方法的一个实施例的流程图。所述的产品推荐方法，包括以下步骤：

步骤S201，获取多个样本客户的训练样本，各样本客户为第一产品的购买客户，训练样本带有样本客户对第二产品购买情况的购买标签。

在本实施例中，产品推荐方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式与终端设备进行通信。需要指出的是，上述无线连接方式可以包括但不限于3G/4G/5G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。

具体地，获取多个样本客户的训练样本，训练样本中包含了多种客户特征。各样本客户均为第一产品的购买客户，训练样本带有样本客户对第二产品购买情况的购买标签，购买标签可以记录样本客户是否购买过第二产品，第二产品有多种，购买标签还可以记录样本客户具体购买了哪种第二产品。

通常，第一产品是销售机构的旧类型产品，第一产品已经具有较长的上市时间，销售机构关于第一产品有较多的客户数据。第二产品可以是销售机构的新类型产品，销售机构关于第二产品有较少的客户数据。本申请基于购买过第一产品的客户得到样本客户，对大量的已有客户进行分析，从而实现第二产品的产品推荐。

举例说明，销售机构可以是保险公司，旧类型产品可以是车辆险，新类型产品可以是非车辆险。保险公司过去主要经营车辆险，现在推出了新的非车辆险，例如驾乘险、工程险、责任险。保险公司可以基于购买过车辆险的客户得到样本客户，对购买过车辆险的客户进行分析，挖掘出对非车辆险具有较高购买倾向的客户，并对这些客户进行非车辆险的产品推荐。在购买过车辆险的客户中，有一部分客户也购买过非车辆险，这部分客户的购买标签，会显示客户购买过非车辆险，以及具体购买了哪种非车辆险，例如记录客户购买过工程险和责任险。

步骤S202，根据各训练样本的购买标签，生成各训练样本的状态标签和产品标签。

具体地，购买标签相当于一种购买行为记录，在模型训练之前，根据各训练样本的购买标签，生成各训练样本的状态标签和产品标签，其中，状态标签表示训练样本所对应的样本客户是否购买过第二产品；如果购买过，会继续生成训练样本的产品标签，产品标签表示样本客户具体购买过哪种第二产品。状态标签和产品标签的生成，相当于根据训练需求对购买标签进行规范化处理的过程。

在一个实施例中，即便样本客户没有购买过第二产品，也可以生成产品标签，此时，产品标签为空或者显示为0。

步骤S203，根据带有状态标签的各训练样本训练第一初始预测模型，得到第一预测模型。

具体地，将带有状态标签的各训练样本输入第一初始预测模型，以训练第一初始预测模型，得到第一预测模型。可以理解，第一预测模型用于预测客户是否愿意购买第二产品；由于样本客户均已购买过第一产品，还可以认为第一预测模型用于预测客户是否愿意购买第一产品和第二产品的产品组合。

进一步的，在上述步骤S203之后，还可以包括：获取多个验证样本；将各验证样本分别输入第一预测模型，得到各验证样本的第一验证结果；根据各验证样本的第一验证结果绘制第一预测模型的KS曲线，以根据KS曲线确定分类阈值，第一预测模型基于分类阈值生成目标客户的第一预测结果。

具体地，在训练得到第一预测模型后，获取多个验证样本，验证样本带有状态标签。将各验证样本分别输入第一预测模型，得到各验证样本的第一验证结果，第一验证结果是第一预测模型输出的验证样本所对应客户购买第二产品的预测概率；而状态标签表示验证样本所对应客户对第二产品的实际购买结果。

根据第一预测模型的验证结果和状态标签，计算每个预测概率下的真正率和假正率。其中，真正率计算公式为：TPR＝TP/(TP+FN)，假正率计算公式为：FPR＝FP/(FP+TN)，其中TP是真正例数量，FN是假负例数量，FP是假正例数量，TN是真负例数量。

然后绘制横轴为预测概率的百分位数(从小到大排序)，纵轴为真正率和假正率的差值(KS值)。KS值在理想情况下会在横轴某个位置取得最大值，这表示模型在该概率处达到最佳区分度，可以将该处的概率作为分类阈值。第一预测模型会根据分类阈值将输出的概率值转换为分类结果，即目标客户的第一预测结果。在后续进行预测时，如果第一预测模型输出的概率值大于分类阈值，则认为客户会购买第二产品，否则认为客户不会购买第二产品。

本实施例中，获取多个验证样本并输入第一预测模型，得到各验证样本的第一验证结果；根据各第一验证结果绘制第一预测模型的KS曲线，将真假正率之差最高点对应的概率作为分类阈值，第一预测模型在该概率处具有最佳区分度；根据分类阈值，第一预测模型可以将输出的概率值转换为分类结果，即目标客户的第一预测结果，确保了第一预测结果的准确性。

步骤S204，根据带有产品标签的各训练样本训练第二初始预测模型，得到第二预测模型。

具体地，将带有产品标签的各训练样本输入第二初始预测模型，以训练第二初始预测模型，得到第二预测模型。第二预测模型用于预测客户对各种第二产品进行购买的概率，即客户在每种第二产品上的转化概率。

步骤S205，获取目标客户的客户样本，并将客户样本输入第一预测模型，得到第一预测结果。

具体地，得到第一预测模型和第二预测模型后，完成模型的训练过程，可以进入应用。在应用阶段，获取待预测的目标客户的客户样本，将客户样本输入第一预测模型，得到第一预测结果；目标客户可以是销售机构的已有客户，即该目标客户也曾经购买过第一产品。

步骤S206，当第一预测结果表明目标客户为产品组合倾向客户时，将客户样本输入第二预测模型，得到第二预测结果。

具体地，第一预测结果可以通过概率值表示目标客户购买第二产品的可能性，当该概率值大于预设的分类阈值时，认为目标客户为第二产品倾向客户，即目标客户有较高可能性购买第二产品。由于目标客户也购买过第一产品，可以认为目标客户有较高可能性同时购买第一产品和第二产品，因此也可以将目标客户作为产品组合倾向客户。

当目标客户为产品组合倾向客户时，将客户样本再输入第二预测模型，得到第二预测结果。

步骤S207，根据第一产品和第二预测结果确定产品组合，并根据产品组合向目标客户进行产品推荐。

具体地，第二预测结果包含了目标客户对各种第二产品进行购买的概率，即目标客户在每种第二产品上的转化概率。根据第二预测结果和第一产品可以生成产品组合，基于第二预测结果，目标客户在产品组合上也具有较高的转化概率。根据产品组合对目标客户进行产品推荐，可以有效地提高新类型产品在产品推荐中的准确性和转化率。

进一步的，上述根据第一产品和第二预测结果确定产品组合的步骤可以包括：获取第二预测结果中，目标客户在各候选第二产品上的转化概率；选取具有最大转化概率的候选第二产品，并根据候选第二产品和第一产品生成产品组合。

具体地，获取第二预测结果中，目标客户在各候选第二产品上的转化概率；选取具有最大转化概率的候选第二产品作为待推荐的第二产品，根据候选第二产品和第一产品生成产品组合。例如，承接前述保险公司的例子，根据第二预测结果，目标客户A最可能购买宠物险，则推荐其购买车辆险+宠物险这种保险组合。

本实施例中，根据第二预测结果，选取具有最大转化概率的候选第二产品同第一产品生成产品组合，确保了目标客户有较高概率购买产品组合中的产品，且产品组合的形式可以带来更高的增益。

本实施例中，获取多个样本客户的训练样本，各样本客户为第一产品的购买客户，训练样本带有样本客户对第二产品购买情况的购买标签；根据购买标签生成各训练样本的状态标签和产品标签，状态标签表示样本客户是否购买了第二产品，产品标签表示样本客户具体购买过哪种第二产品；根据带有状态标签的各训练样本训练第一初始预测模型，得到第一预测模型，并根据带有产品标签的各训练样本训练第二初始预测模型，得到第二预测模型；获取目标客户的客户样本并输入第一预测模型，得到第一预测结果；第一预测结果表示目标客户是否愿意购买第二产品，由于目标客户也是第一产品的已有客户，当目标客户愿意购买第二产品时，表示目标客户为产品组合倾向客户时；将客户样本输入第二预测模型，得到第二预测结果，第二预测结果包含目标客户购买每种第二产品的概率；根据第一产品和第二预测结果可以生成具有较高转化概率产品组合，根据产品组合向目标客户进行产品推荐，确保了具有较高增益，更提高了新类型产品在产品推荐中的准确性和转化率。

进一步的，上述获取多个样本客户的训练样本的步骤可以包括：获取多个初始样本客户的初始训练样本，初始训练样本带有初始样本客户对第一产品购买情况的第一标签；根据各初始样本客户的第一标签，在各初始样本客户中筛选稳定客户，并将筛选到的稳定客户确定为样本客户；通过随机森林对各样本客户的初始训练样本进行特征筛选，得到各样本客户的第一训练样本；根据预设的交叉特征算法对各样本客户的第一训练样本进行交叉特征处理，得到各样本客户的训练样本。

具体地，获取多个初始样本客户的初始训练样本，初始训练样本带有初始样本客户对第一产品购买情况的第一标签，第一标签可以记录初始样本客户在哪些时间(例如在哪些自然年)购买了第一产品。

根据各初始样本客户的第一标签，在各初始样本客户中筛选稳定客户。在至少两个预设时间周期内，如果初始样本客户均购买了第一产品，则该客户为稳定客户。例如，客户A在2020年从公司B购买了保险产品C，并在2021年续保又购买了保险产品D，则客户A为续保客户，续保客户可以作为稳定客户。

稳定客户对产品具有较多、较稳定的购买行为，表明他们对销售机构的产品具有一定的购买意识和理解，可能更容易接受第一产品之外的第二产品，也对销售机构更加信任，这在进行第二产品的推荐时会带来转化概率上的优势。同时，稳定客户通常具有更多的客户数据，可以提供更多的客户特征用于模型训练，可以提高模型的准确性。将筛选到的稳定客户确定为样本客户。

通过随机森林可以计算各样本客户的初始训练样本中，各客户特征的特征贡献度；在使用随机森林时，可能还需要使用到各样本客户对第二产品购买情况的购买标签，以用于决策树的分裂。将每种客户特征的特征贡献度进行降序排序，筛选预设数量的客户特征(或者筛选出相应比例的客户特征)。保留各初始训练样本中，筛选出的较为重要的客户特征的客户数据，得到各样本客户的第一训练样本。

举例说明，当销售机构为保险公司时，保留下的客户特征包括：客户年龄、客户类型、客户性别、客户所属地区、客户学历、客户职业、客户民族、征信等级、是否转介绍、是否为微信客户、客户微信是否关注公众号、是否为一人多车、是否下载预设软件、是否为新能源车、车辆价值、车系、是否有小孩、是否有房、是否有宠物、是否结婚等等。以上特征维度如某客户没有则置为空。

根据预设的交叉特征算法对各样本客户的第一训练样本进行交叉特征处理，交叉特征处理是在各第一训练样本中，考虑不同种类客户特征之间的交互作用，将它们进行组合以创建新的特征并对应添加到第一训练样本中，从而得到各样本客户的训练样本。

本实施例中，获取多个初始样本客户的初始训练样本，根据初始训练样本携带的初始样本客户对第一产品购买情况的第一标签，在各初始样本客户中筛选稳定客户，并将筛选到的稳定客户确定为样本客户；稳定客户对产品具有较高的接受度，且客户数据较为丰富，可以提高新类型产品的转化概率以及模型准确性；通过随机森林从各样本客户的初始训练样本中筛选重要的客户特征，得到各样本客户的第一训练样本；根据交叉特征算法对各样本客户的第一训练样本进行交叉特征处理，将不同的客户特征进行组合后添加到第一训练样本中得到各样本客户的训练样本，考虑了不同客户特征之间的交互作用，确保了后续模型训练的准确性。

进一步的，上述根据预设的交叉特征算法对各样本客户的第一训练样本进行交叉特征处理，得到各样本客户的训练样本的步骤可以包括：获取各样本客户的第一训练样本的购买标签；根据获取到的购买标签，将各第一训练样本划分为已购买样本和未购买样本；基于得到的已购买样本和未购买样本，通过预设的统计检验算法计算各客户特征的差异度；根据得到的差异度从各客户特征中选取出至少一个差异特征，并从各客户特征中选取出至少一个待交叉特征；对于各第一训练样本，将选取到的差异特征和待交叉特征进行交叉组合得到已交叉特征，并将各已交叉特征对应添加到各第一训练样本中，得到各样本客户的训练样本。

具体地，获取各样本客户的第一训练样本的购买标签；根据获取到的购买标签，将各第一训练样本划分为已购买样本和未购买样本。对于每种客户特征，将已购买样本中该客户特征的特征数据划分到第一集合中，将未购买样本中该客户特征的特征数据划分到第二集合中。然后通过预设的统计检验算法计算第一集合和第二集合之间的差异度，将该差异度作为该客户特征的差异度。统计检验算法包括独立样本t检验、ANOVA、非参数检验方法等，根据客户特征的特征属性选取合适的统计检验算法。

举例说明，现有客户特征：年龄，希望确定已购买样本和未购买样本在年龄上是否存在显著性差异，可以使用独立样本t检验。假设第一产品为车险，第二产品为非车险，现有：

假设购买过车险客户年龄数据：[32,34,38,37,29]

未购买过车险客户年龄数据：[25,28,30,27,26]

通过独立样本t检验进行数学计算，可以验证已购买样本和未购买样本在年龄上的差异度，从而确定两类样本在年龄上是否存在显著性差异。

根据得到的差异度从各客户特征中选取出至少一个差异特征，例如选取出差异度排在前M(M为正整数)位的客户特征作为差异特征，选取出的客户特征在已购买样本和未购买样本中存在显著性差异，具有较高的研究价值。

从各客户特征中选取出至少一个待交叉特征。需要指出的是，待交叉特征不能与差异特征重复，即，一个客户特征不能既作为差异特征，又作为待交叉特征。

对于每个第一训练样本，将该样本中的差异特征和待交叉特征进行交叉组合得到已交叉特征，并将得到的已交叉特征添加到该第一训练样本中，从而对该第一训练样本进行了更新，得到训练样本。

假设数据显示，年轻女性在某一地区更有可能购买家庭保险。可以通过以下方式在模型中使用交叉特征：

年龄和性别的交叉特征：创建一个新特征，表示年龄和性别的组合。例如，年龄在18到30岁之间且性别为女性的客户可以被编码为“年轻女性”。这个特征可以帮助模型更好地捕捉不同年龄和性别组合对购买行为的影响。

年龄和地区的交叉特征：创建一个新特征，表示年龄和地区的组合。这可以捕捉到不同年龄段在不同地区的购买偏好。

性别和地区的交叉特征：类似地，创建性别和地区的组合特征，以便更好地理解不同性别和地区组合的影响。

通过引入这些交叉特征，可以提高模型对不同组合的敏感性，从而更好地捕捉潜在的购买行为模式。

本实施例中，根据各样本客户的第一训练样本的购买标签，将各第一训练样本划分为已购买样本和未购买样本；基于得到的已购买样本和未购买样本，通过预设的统计检验算法计算各客户特征的差异度，差异度反应客户特征在两类样本中是否存在显著性差异；根据得到的差异度从各客户特征中选取出至少一个差异特征，从各客户特征中选取出至少一个待交叉特征；对于各第一训练样本，将选取到的差异特征和待交叉特征进行交叉组合得到已交叉特征，并将各已交叉特征对应添加到各第一训练样本中，得到各样本客户的训练样本，使得模型可以提高对不同组合的敏感性，捕捉更多的信息以提高预测的准确性。

进一步的，上述从各客户特征中选取出至少一个待交叉特征的步骤可以包括：根据各客户特征的特征贡献度，从各客户特征中选取出至少一个待交叉特征，特征贡献度由随机森林计算得到；或者，随机从各客户特征中选取出至少一个待交叉特征。

具体地，上文在得到第一训练样本的过程中，通过随机森林计算出了各客户特征的特征贡献度。选取特征贡献度排在前N(N为正整数)位的客户特征作为待交叉特征，选取出的待交叉特征较为重要，确保了模型可以学习到重要信息。

或者，随机从各客户特征中选取出至少一个待交叉特征。

本实施例中，根据各客户特征的特征贡献度，从各客户特征中选取出较为重要的待交叉特征，确保了模型可以从重要特征中学习到更多信息，提高了模型的准确性；或者，随机从各客户特征中选取出至少一个待交叉特征，丰富了待交叉特征的选取方式。

进一步的，上述获取目标客户的客户样本的步骤可以包括：获取目标客户的初始客户样本；对初始客户样本进行特征筛选，并通过交叉特征算法对特征筛选后的初始客户样本进行交叉特征处理，得到客户样本。

具体地，在应用中，获取目标客户的初始客户样本；在前文提到随机森林计算出了各客户特征的特征贡献度，并根据特征贡献度进行了特征筛选。为确保特征维度的一致性，根据之前筛选出的客户特征，对初始客户样本进行特征筛选。

通过交叉特征算法对特征筛选后的初始客户样本进行交叉特征处理，得到客户样本；在交叉特征处理中，选取的差异特征和待交叉特征应与之前选取的差异特征和待交叉特征保持一致。

本实施例中，获取目标客户的初始客户样本，对初始客户样本进行特征筛选，并通过交叉特征算法对特征筛选后的初始客户样本进行交叉特征处理，以对初始客户样本进行规范化处理并生成客户样本；特征筛选和交叉特征处理中选取的客户特征应该与训练样本构建过程中涉及的客户特征保持一致，以确保模型可以准确进行预测。

需要强调的是，为进一步保证上述训练样本的私密和安全性，上述训练样本还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图3，作为对上述图2所示方法的实现，本申请提供了一种产品推荐装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图3所示，本实施例所述的产品推荐装置300包括：训练获取模块301、标签生成模块302、第一训练模块303、第二训练模块304、第一预测模块305、第二预测模块306以及组合推荐模块307，其中：

训练获取模块301，用于获取多个样本客户的训练样本，各样本客户为第一产品的购买客户，训练样本带有样本客户对第二产品购买情况的购买标签。

标签生成模块302，用于根据各训练样本的购买标签，生成各训练样本的状态标签和产品标签。

第一训练模块303，用于根据带有状态标签的各训练样本训练第一初始预测模型，得到第一预测模型。

第二训练模块304，用于根据带有产品标签的各训练样本训练第二初始预测模型，得到第二预测模型。

第一预测模块305，用于获取目标客户的客户样本，并将客户样本输入第一预测模型，得到第一预测结果。

第二预测模块306，用于当第一预测结果表明目标客户为产品组合倾向客户时，将客户样本输入第二预测模型，得到第二预测结果。

组合推荐模块307，用于根据第一产品和第二预测结果确定产品组合，并根据产品组合向目标客户进行产品推荐。

在本实施例的一些可选的实现方式中，训练获取模块301可以包括：初始获取子模块、客户筛选子模块、特征筛选子模块以及交叉处理子模块，其中：

初始获取子模块，用于获取多个初始样本客户的初始训练样本，初始训练样本带有初始样本客户对第一产品购买情况的第一标签。

客户筛选子模块，用于根据各初始样本客户的第一标签，在各初始样本客户中筛选稳定客户，并将筛选到的稳定客户确定为样本客户。

特征筛选子模块，用于通过随机森林对各样本客户的初始训练样本进行特征筛选，得到各样本客户的第一训练样本。

交叉处理子模块，用于根据预设的交叉特征算法对各样本客户的第一训练样本进行交叉特征处理，得到各样本客户的训练样本。

在本实施例的一些可选的实现方式中，交叉处理子模块可以包括：标签获取单元、样本划分单元、差异计算单元、特征选取单元以及交叉组合单元，其中：

标签获取单元，用于获取各样本客户的第一训练样本的购买标签。

样本划分单元，用于根据获取到的购买标签，将各第一训练样本划分为已购买样本和未购买样本。

差异度计算单元，用于基于得到的已购买样本和未购买样本，通过预设的统计检验算法计算各客户特征的差异度。

特征选取单元，用于根据得到的差异度从各客户特征中选取出至少一个差异特征，并从各客户特征中选取出至少一个待交叉特征。

交叉组合单元，用于对于各第一训练样本，将选取到的差异特征和待交叉特征进行交叉组合得到已交叉特征，并将各已交叉特征对应添加到各第一训练样本中，得到各样本客户的训练样本。

在本实施例的一些可选的实现方式中，特征选取单元可以包括：贡献度选取子单元以及随机选取子单元，其中：

贡献度选取子单元，用于根据各客户特征的特征贡献度，从各客户特征中选取出至少一个待交叉特征，特征贡献度由随机森林计算得到。

随机选取子单元，用于随机从各客户特征中选取出至少一个待交叉特征。

在本实施例的一些可选的实现方式中，产品推荐装置300还可以包括：验证获取模块、验证输入模块以及阈值确定模块，其中：

验证获取模块，用于获取多个验证样本。

验证输入模块，用于将各验证样本分别输入第一预测模型，得到各验证样本的第一验证结果。

阈值确定模块，用于根据各验证样本的第一验证结果绘制第一预测模型的KS曲线，以根据KS曲线确定分类阈值，第一预测模型基于分类阈值生成目标客户的第一预测结果。

在本实施例的一些可选的实现方式中，第一预测模块305可以包括：初始获取子模块以及初始处理子模块，其中：

初始获取子模块，用于获取目标客户的初始客户样本。

初始处理子模块，用于对初始客户样本进行特征筛选，并通过交叉特征算法对特征筛选后的初始客户样本进行交叉特征处理，得到客户样本。

在本实施例的一些可选的实现方式中，组合推荐模块307可以包括：概率获取子模块以及组合生成子模块，其中：

概率获取子模块，用于获取第二预测结果中，目标客户在各候选第二产品上的转化概率。

组合生成子模块，用于选取具有最大转化概率的候选第二产品，并根据候选第二产品和第一产品生成产品组合。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图4，图4为本实施例计算机设备基本结构框图。

所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是，图中仅示出了具有组件41-43的计算机设备4，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable GateArray，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器41至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器41可以是所述计算机设备4的内部存储单元，例如该计算机设备4的硬盘或内存。在另一些实施例中，所述存储器41也可以是所述计算机设备4的外部存储设备，例如该计算机设备4上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(FlashCard)等。当然，所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中，所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件，例如产品推荐方法的计算机可读指令等。此外，所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中，所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据，例如运行所述产品推荐方法的计算机可读指令。

所述网络接口43可包括无线网络接口或有线网络接口，该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。

本实施例中提供的计算机设备可以执行上述产品推荐方法。此处产品推荐方法可以是上述各个实施例的产品推荐方法。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的产品推荐方法的步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

1.一种产品推荐方法，其特征在于，包括下述步骤：

2.根据权利要求1所述的产品推荐方法，其特征在于，所述获取多个样本客户的训练样本的步骤包括：

获取多个初始样本客户的初始训练样本，初始训练样本带有初始样本客户对第一产品购买情况的第一标签；

根据各初始样本客户的第一标签，在所述各初始样本客户中筛选稳定客户，并将筛选到的稳定客户确定为样本客户；

通过随机森林对各样本客户的初始训练样本进行特征筛选，得到所述各样本客户的第一训练样本；

根据预设的交叉特征算法对所述各样本客户的第一训练样本进行交叉特征处理，得到所述各样本客户的训练样本。

3.根据权利要求2所述的产品推荐方法，其特征在于，所述根据预设的交叉特征算法对所述各样本客户的第一训练样本进行交叉特征处理，得到所述各样本客户的训练样本的步骤包括：

获取各样本客户的第一训练样本的购买标签；

根据获取到的购买标签，将各第一训练样本划分为已购买样本和未购买样本；

基于得到的已购买样本和未购买样本，通过预设的统计检验算法计算各客户特征的差异度；

根据得到的差异度从所述各客户特征中选取出至少一个差异特征，并从所述各客户特征中选取出至少一个待交叉特征；

对于所述各第一训练样本，将选取到的差异特征和待交叉特征进行交叉组合得到已交叉特征，并将各已交叉特征对应添加到所述各第一训练样本中，得到所述各样本客户的训练样本。

4.根据权利要求3所述的产品推荐方法，其特征在于，所述从所述各客户特征中选取出至少一个待交叉特征的步骤包括：

根据所述各客户特征的特征贡献度，从所述各客户特征中选取出至少一个待交叉特征，特征贡献度由所述随机森林计算得到；或者，

随机从所述各客户特征中选取出至少一个待交叉特征。

5.根据权利要求1所述的产品推荐方法，其特征在于，在所述根据带有状态标签的所述各训练样本训练第一初始预测模型，得到第一预测模型的步骤之后，还包括：

获取多个验证样本；

将各验证样本分别输入所述第一预测模型，得到所述各验证样本的第一验证结果；

根据所述各验证样本的第一验证结果绘制所述第一预测模型的KS曲线，以根据所述KS曲线确定分类阈值，所述第一预测模型基于所述分类阈值生成目标客户的第一预测结果。

6.根据权利要求2所述的产品推荐方法，其特征在于，所述获取目标客户的客户样本的步骤包括：

获取目标客户的初始客户样本；

对所述初始客户样本进行特征筛选，并通过所述交叉特征算法对特征筛选后的初始客户样本进行交叉特征处理，得到客户样本。

7.根据权利要求1所述的产品推荐方法，其特征在于，所述根据所述第一产品和所述第二预测结果确定产品组合的步骤包括：

获取所述第二预测结果中，所述目标客户在各候选第二产品上的转化概率；

选取具有最大转化概率的候选第二产品，并根据所述候选第二产品和所述第一产品生成产品组合。

8.一种产品推荐装置，其特征在于，包括：

9.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的产品推荐方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的产品推荐方法的步骤。