CN112784168A

CN112784168A - 信息推送模型训练方法以及装置、信息推送方法以及装置

Info

Publication number: CN112784168A
Application number: CN202110210894.7A
Authority: CN
Inventors: 张景莲
Original assignee: Ping An Health Insurance Company of China Ltd
Current assignee: Ping An Health Insurance Company of China Ltd
Priority date: 2021-02-25
Filing date: 2021-02-25
Publication date: 2021-05-11
Anticipated expiration: 2041-02-25
Also published as: CN112784168B

Abstract

本发明涉及预测模型技术领域，揭露了一种信息推送模型训练、信息推送方法、装置、设备及介质。该方法通过将样本信息宽表输入至初始预测模型，确定与各样本分群对应的分群预测分值；运用注意力机制技术，根据样本分群分值以及分群预测分值，调整样本权重；根据调整后的样本权重、分群标签分值以及分群预测分值，确定各样本分群预测损失值；将各样本分群对应的预测损失值输入至总损失函数中，确定初始预测模型的总损失值；在总损失值未达到预设的收敛条件时，更新迭代初始预测模型的初始参数，直至总损失值达到预设的收敛条件时，将收敛之后的初始预测模型记录为信息推送模型。本发明提高了初始预测模型预测的准确性。

Description

信息推送模型训练方法以及装置、信息推送方法以及装置

技术领域

本发明涉及预测模型技术领域，尤其涉及一种信息推送模型训练、信息推送方法、装置、计算机设备及存储介质。

背景技术

随着科学技术的发展，越来越多的应用程序会给各个用户推送各类信息，例如新产品信息、新福利活动信息等推荐信息，进而使得用户可以快速触及新产品或者新活动的内容。

目前，针对于用户进行信息推送或者产品推送，均是通过采集与用户信息，进而通过预测模型根据用户信息进行预测，以向用户推送与用户信息相关的信息或者产品。但是该方法存在以下不足：预测模型在预测到与用户信息相关的信息之后，为了提高信息推送效率，会选择将所有信息都推送至用户中，则会存在不能够针对性推送的现象，导致用户根本不会查收那些不感兴趣的信息，进而导致模型预测准确率较低。

发明内容

本发明实施例提供一种信息推送模型训练、信息推送方法、装置、计算机设备及存储介质，以解决信息推送准确率低的问题。

一种信息推送模型训练方法，包括：

获取样本信息宽表集；所述样本信息宽表集包含至少一个样本信息宽表；所述样本信息宽表关联至少一个样本分群；一个所述样本分群均关联一个样本分群分值以及一个样本权重；

将所述样本信息宽表输入至包含初始参数的初始预测模型，以根据所述样本信息宽表对各所述样本分群进行意愿预测，确定与各所述样本分群对应的分群预测分值；

运用注意力机制技术，根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值，调整与该样本分群关联的样本权重；

根据与同一样本分群对应的调整后的样本权重、分群标签分值以及分群预测分值，确定与该样本分群的预测损失值；

将各所述样本分群对应的预测损失值输入至总损失函数中，以确定所述初始预测模型的总损失值；

在所述总损失值未达到预设的收敛条件时，更新迭代所述初始预测模型的初始参数，直至所述总损失值达到所述预设的收敛条件时，将收敛之后的所述初始预测模型记录为信息推送模型。

一种信息推送方法，包括：

获取目标用户的目标信息宽表；所述目标信息宽表中包含与所述目标用户关联的各目标分群对应的分群信息；

将所述目标信息宽表输入至信息推送模型中，根据各所述目标分群对应的分群信息，对各所述目标分群进行意愿预测，确定与各所述目标分群对应的目标预测分值；所述信息推送模型是根据上述信息推送模型训练方法生成的；

将各所述目标分群对应的目标预测分值发送至预设推荐平台，并输出各目标分群推荐的优先级顺序，以令所述预设推荐平台向各所述目标用户进行信息推送。

一种信息推送模型训练装置，包括：

信息宽表获取模块，用于获取样本信息宽表集；所述样本信息宽表集包含至少一个样本信息宽表；所述样本信息宽表关联至少一个样本分群；一个所述样本分群均关联一个样本分群分值以及一个样本权重；

分群意愿预测模块，用于将所述样本信息宽表输入至包含初始参数的初始预测模型，以根据所述样本信息宽表对各所述样本分群进行意愿预测，确定与各所述样本分群对应的分群预测分值；

样本权重调整模块，用于运用注意力机制技术，根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值，调整与该样本分群关联的样本权重；

预测损失值确定模块，用于根据与同一样本分群对应的调整后的样本权重、分群标签分值以及分群预测分值，确定与该样本分群的预测损失值；

总损失值确定模块，用于将各所述样本分群对应的预测损失值输入至总损失函数中，以确定所述初始预测模型的总损失值；

参数更新迭代模块，用于在所述总损失值未达到预设的收敛条件时，更新迭代所述初始预测模型的初始参数，直至所述总损失值达到所述预设的收敛条件时，将收敛之后的所述初始预测模型记录为信息推送模型。

一种信息推送装置，包括：

目标宽表获取模块，用于获取目标用户的目标信息宽表；所述目标信息宽表中包含与所述目标用户关联的各目标分群对应的分群信息；

意愿预测模块，用于将所述目标信息宽表输入至信息推送模型中，根据各所述目标分群对应的分群信息，对各所述目标分群进行意愿预测，确定与各所述目标分群对应的目标预测分值；所述信息推送模型是根据上述信息推送模型训练方法生成的；

信息推送模块，用于将各所述目标分群对应的目标预测分值发送至预设推荐平台，并输出各目标分群推荐的优先级顺序，以令所述预设推荐平台向各所述目标用户进行信息推送。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述信息推送模型训练方法，或者所述处理器执行所述计算机程序时实现上述信息推送方法。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述信息推送模型训练方法，或者所述计算机程序被处理器执行时实现上述信息推送方法。

上述信息推送模型训练、信息推送方法、装置、计算机设备及存储介质，该信息推送模型训练方法通过获取样本信息宽表集；所述样本信息宽表集包含至少一个样本信息宽表；所述样本信息宽表关联至少一个样本分群；一个所述样本分群均关联一个样本分群分值以及一个样本权重；将所述样本信息宽表输入至包含初始参数的初始预测模型，以根据所述样本信息宽表对各所述样本分群进行意愿预测，确定与各所述样本分群对应的分群预测分值；运用注意力机制技术，根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值，调整与该样本分群关联的样本权重；根据与同一样本分群对应的调整后的样本权重、分群标签分值以及分群预测分值，确定与该样本分群的预测损失值；将各所述样本分群对应的预测损失值输入至总损失函数中，以确定所述初始预测模型的总损失值；在所述总损失值未达到预设的收敛条件时，更新迭代所述初始预测模型的初始参数，直至所述总损失值达到所述预设的收敛条件时，将收敛之后的所述初始预测模型记录为信息推送模型。

本发明在对初始预测模型训练过程，通过运用注意力机制技术，调整与样本分群关联的样本权重的方法，可以不断增强样本权重之中对识别有用的权重，并且能够将对抗的样本权重增强以防止过拟合，以增强有用的特征识别的结果，进而提高初始预测模型预测的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中信息推送模型训练方法的一应用环境示意图；

图2是本发明一实施例中信息推送模型训练方法的一流程图；

图3是本发明一实施例中信息推送模型训练方法的另一流程图；

图4是本发明一实施例中信息推送模型训练方法的又一流程图；

图5是本发明一实施例中信息推送方法的一流程图；

图6是本发明一实施例中信息推送模型训练装置的一原理框图；

图7是本发明一实施例中信息推送模型训练装置的另一原理框图；

图8是本发明一实施例中信息推送模型训练装置的又一原理框图；

图9是本发明一实施例中信息推送装置的一原理框图；

图10是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的信息推送模型训练方法，该信息推送模型训练方法可应用如图1所示的应用环境中。具体地，该信息推送模型训练方法应用在信息推送模型训练系统中，该信息推送模型训练系统包括如图1所示的客户端和服务器，客户端与服务器通过网络进行通信，用于解决信息推送准确率低的问题。其中，客户端又称为用户端，是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种信息推送模型训练方法，以该方法应用在图1中的服务器为例进行说明，包括如下步骤：

S10：获取样本信息宽表集；所述样本信息宽表集包含至少一个样本信息宽表；所述样本信息宽表关联至少一个样本分群；一个所述样本分群均关联一个样本分群分值以及一个样本权重。

可以理解地，样本信息宽表可以通过样本用户的历史动作信息、与样本用户关联的样本分群的历史动作信息生成，该历史动作信息可以根据不同场景进行限定，示例性地，在金融产品推荐场景下，该历史动作信息可以为样本用户历史购买金融产品记录、金融产品相关APP的浏览记录，或者与样本用户关联的样本分群历史购买金融产品记录等；在电影信息推荐场景下，历史动作信息可以为样本用户历史购买电影票的记录，亦或者在各电影票出售的APP上的浏览记录等。其中，在金融产品推荐场景下，样本用户可以为购买过金融产品的用户，亦或者是注册过相应的应用程序的用户；在电影信息推荐场景下，样本用户可以为购买过电影票的用户，亦或者是注册过相应的应用程序的用户。

进一步地，样本分群为与样本用户具有关联关系且每一样本分群中的用户具有相同特征，示例性地，在金融产品推荐场景下，该样本分群可以根据购买的金融产品进行划分，亦或者根据购买的金融产品的数量进行划分；在电影信息推荐场景下，该样本分群可以根据电影类型进行划分，如样本分群可以为爱情电影分群、动作电影分群、动画电影分群等；示例性地，在金融产品推荐场景下，样本分群分值为各样本分群对金融产品购买的意向值，该样本分群分值可以根据与样本分群对应的历史购买记录或者浏览记录等动作信息进行评估；在电影信息推荐场景下，样本分群分值为各样本分群对电影票购买的意向值，如在爱情电影分群中为对爱情电影的电影票购买的意向值是多少，该样本分群分值可以根据与其对应的历史购买记录或者浏览记录等动作信息进行评估。

S20：将所述样本信息宽表输入至包含初始参数的初始预测模型，以根据所述样本信息宽表对各所述样本分群进行意愿预测，确定与各所述样本分群对应的分群预测分值。

可选地，初始预测模型可以为XGBoost模型。分群预测分值指的是通过初始预测模型根据样本信息宽表对各样本分群进行意愿预测得到的。

具体地，在获取样本信息宽表集之后，将样本信息宽表输入至包含初始参数的初始预测模型中，进而根据样本信息宽表中如与样本用户关联的样本分群的历史动作信息，对各样本分群进行意愿预测，确定与各样本分群对应的分群预测分值，也即预测各样本分群对不同类型的信息的感兴趣程度。

S30：运用注意力机制技术，根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值，调整与该样本分群关联的样本权重。

可理解地，所述注意力机制技术为在迭代训练过程中不断增强样本权重之中对识别有用的权重，通过注意力机制的权重调整，能够将对抗的样本权重增强以防止过拟合，以增强有用的特征识别的结果，并且提高初始预测模型预测的准确性。

S40：根据与同一样本分群对应的调整后的样本权重、分群标签分值以及分群预测分值，确定与该样本分群的预测损失值。

可以理解地，预测损失值指的是初始预测模型对各样本分群进行意愿预测得到的分群预测分值，与分群标签分值之间的差异程度。

具体地，在运用注意力机制技术，根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值，调整与该样本分群关联的样本权重，根据与同一样本分群对应的调整后的样本权重、分群标签分值以及分群预测分值，确定与该样本分群的预测损失值。

S50：将各所述样本分群对应的预测损失值输入至总损失函数中，以确定所述初始预测模型的总损失值。

其中，总损失函数为：

其中，L(φ)为总损失值；λi为第i个样本分群关联的调整后的样本权重；

为样本信息宽表的第i个样本分群的分群预测分值；y_i为样本信息宽表第i个样本分群的样本分群分值；

为第i个样本分群的预测损失值；Ω(f_k)为初始预测模型的正则化函数，该正则化函数用于防止在训练过程中，初始预测模型过拟合；k表征初始预测模型的迭代数，可以理解地，针对一个样本信息宽表对初始预测模型进行一次训练记录为初始预测模型迭代一次，进而k表征针对一个样本信息宽表对初始预测模型训练时，采用正则化函数对样本信息宽表进行防过拟合处理的次数。

S60：在所述总损失值未达到预设的收敛条件时，更新迭代所述初始预测模型的初始参数，直至所述总损失值达到所述预设的收敛条件时，将收敛之后的所述初始预测模型记录为信息推送模型。

可以理解地，该收敛条件可以为总损失值小于设定阈值的条件，也即在总损失值小于设定阈值时，停止训练；收敛条件还可以为总损失值经过了10000次计算后值为很小且不会再下降的条件，也即总损失值经过10000次计算后值很小且不会下降时，停止训练，并将收敛之后的所述初始预测模型记录为信息推送模型。

进一步地，根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值，确定所述初始预测模型的总损失值之后，在总损失值未达到预设的收敛条件时，根据该总损失值调整初始预测模型的初始参数，并将该样本信息宽表重新输入至调整初始参数后的初始预测模型中，以在该样本信息宽表对应的预测损失值达到预设的收敛条件时，选取样本信息宽表集中另一样本信息宽表，并执行上述步骤S10至S50，并得到与该样本信息宽表对应的总损失值，并在该总损失值未达到预设的收敛条件时，根据该总损失值再次调整初始预测模型的初始参数，使得该样本信息宽表对应的总损失值达到预设的收敛条件。

如此，在通过样本信息宽表集中所有样本信息宽表对初始预测模型进行训练之后，使得初始预测模型输出的结果可以不断向准确地结果靠拢，让识别准确率越来越高，直至所有样本信息宽表对应的总损失值均达到预设的收敛条件时，将收敛之后的所述初始预测模型记录为信息推送模型。

在本实施例中，在对初始预测模型训练过程，通过运用注意力机制技术，调整与样本分群关联的样本权重的方法，可以不断增强样本权重之中对识别有用的权重，并且能够将对抗的样本权重增强以防止过拟合，以增强有用的特征识别的结果，进而提高初始预测模型预测的准确性。

在一实施例中，如图3所示，步骤S10之前，也即所述获取样本信息宽表集之前，信息推送模型训练方法还包括：

S01：获取多个样本用户的历史动作信息，并确定所述历史动作信息的信息数量。

示例性地，可以通过第三方平台(如神策)获取行为数据(如在金融产品推荐场景中，行为数据可以为样本用户购买金融产品的次数，或者样本用户浏览某个金融产品的次数)或通过WebHook获取触发事件数据(触发时间数据也可以为样本用户购买金融产品的次数，或者样本用户浏览某个金融产品的次数)作为各样本用户的历史动作信息。

可以理解地，在本实施例中，信息数量特指样本用户购买电影票的数量。

S02：根据所述信息数量，将各所述样本用户分为历史用户分群以及萌新用户分群。

示例性地，若信息数量少于5，则表征该样本用户购买金融产品少于五次，因此可以将其归属于萌新用户分群；若信息数量大于或等于5，则表征该样本用户购买金融产品次数多于五次，因此可以将其归属于历史用户分群。需要说明的是，上述对样本用户进行分类的过程仅仅是一种示例，可以根据具体应用场景的需求进行调整，在此不再赘述。

S03：在第一监测周期中，获取所述历史用户分群中各历史样本用户的第一监测信息；同时，在第二监测周期中，获取所述萌新用户分群中各萌新样本用户的第二监测信息。

可以理解地，第一监测周期和第二监测周期可以根据具体应用场景进行设定；示例性地，在电影信息推荐场景中，针对于历史样本用户，可以根据历史样本用户的购买电影票的时间间隔进行设定，例如在步骤S01中获取到样本用户的历史动作信息之后，若该样本用户属于历史样本用户分群，进而可以确定其购买电影票的频率，进而可以根据该样本用户购买电影票的时间间隔确定第一监测周期；针对于萌新样本用户，可以根据萌新样本用户具有的优惠券的截止时间设定，对于购买电影票较少的样本用户，一般会给他们一些优惠券，进而可以根据各优惠券的截止时间设定第二监测周期。

进一步地，第一监测信息或者第二监测信息可以包含历史样本用户的个人信息(如性别、年龄等)，应用程序动作信息(如应用程序浏览记录、应用程序购买记录等)。

S04：执行hive sql脚本对所述第一监测信息以及所述第二监测信息进行信息校验，得到与所述第一监测信息对应的历史特征信息，以及与所述第二监测信息对应的萌新特征信息。

可以理解地，hive sql脚本用于执行信息校验逻辑计算，该hive sql可以对第一监测信息中的多个数据进行关联或者聚合计算，以进行信息校验。一般地，对于第一监测信息或者第二监测信息中的个人信息不需要通过hive sql脚本进行信息校验，因此在执行hive sql脚本执行信息校验时，仅需要针对如应用程序浏览记录、应用程序购买记录等进行信息校验即可，进而在通过信息校验之后，即可提取第一监测信息或者第二监测信息中对模型训练有正向帮助的信息，进而得到与第一监测信息对应的历史特征信息，以及与第二监测信息对应的萌新特征信息。历史特征标签指的是对历史特征信息进行分类之后，每一类历史特征信息对应的分类标签，如在电影信息推荐场景中，历史特征标签可以为浏览信息标签，购买记录标签等。

S05：对所述历史特征信息进行预处理，得到与所述历史样本用户对应的历史样本信息宽表；同时，对所述萌新特征信息进行预处理，得到与所述萌新样本用户对应的萌新样本信息宽表。

可以理解地，对历史特征信息进行预处理过程指的是对历史特征信息进行数据清洗的过程，如剔除对初始预测模型训练没有正向作用的数据、冗余数据等。

具体地，在一实施例中，步骤S05中，一个历史特征信息关联一个历史特征标签包括：

(1)对所述历史特征信息进行冗余特征检测，在所述历史特征信息中包括冗余特征时，剔除包含所述冗余特征的历史特征信息，并将剔除后的历史特征信息记录为剔除特征信息。

可以理解地，冗余特征指的是历史特征信息中对初始预测模型训练贡献度不大的特征，示例性地，冗余特征可以为历史特征信息中空值过多，或者方差接近0的特征。

(2)对同一历史特征标签的剔除特征信息进行热力图展示，确定各所述剔除特征信息之间的特征重合率。

可以理解地，由于各个场景下的数据量庞大，进而存在相同的特征在不同的逻辑设计下会存在不同的表达，进而在模型训练中，使用相同的特征对初始预测模型训练时，对初始预测模型的贡献度较小，因此，针对同一个历史特征标签中的剔除特征信息进行热力图展示的方式，亦或者相关性计算的方式，确定各剔除特征信息之间的特征重合率，该特征重合率可以通过热力图中各剔除特征信息之间重合颜色进行确定，重合颜色越深，表征剔除特征信息之间重复较多。

(3)在所述特征重合率大于或等于预设重合阈值时，确定各所述剔除特征信息与所述历史特征标签之间的特征相关值。

可以理解地，在特征重合率大于或等于预设重合阈值时，表征存在较为相同的剔除特征信息，进而确定剔除特征信息与历史特征标签之间的相关值，示例性地，可以通过皮尔逊相关系数确定各所述剔除特征信息与对应的所述历史特征标签之间的相关值。

(4)剔除除特征相关值最大的剔除特征信息之外的其它剔除特征信息之后，得到所述历史样本信息宽表。

具体地，在确定各所述剔除特征信息与所述历史特征标签之间的特征相关值之后，剔除除特征相关值最大的剔除特征信息之外的其它剔除特征信息之后，得到所述历史样本信息宽表。进一步地，针对于萌新特征信息，该萌新特征信息关联一个萌新特征标签，对萌新特征信息进行预处理过程，与上述步骤(1)至(4)相同，在此不再赘述。

进一步地，除上述之外，对历史特征信息或者萌新特征信息进行预处理还可以包括如下方法：

对样本信息宽表中的每一历史特征信息或者萌新特征信息的分布情况进行可视化，比如直方图分布、概率密度分布等；若根据分布图发现某些特征信息存在异常点，针对这些异常特征信息可以进行如下处理，比如直接剔除异常数据行或替换异常数据为一个合适的值；或者特征变换，也即针对一些长尾分布的特征信息，可对该特征信息进行幂变换或对数变换，如使右偏的特征信息分布变换成正态分布，使其更适合初始预测模型进行训练学习；对一些连续变量的特征信息进行离散化，如年龄进行分段表示，比如等宽/等频进行分段，或通过如聚类算法获得最佳分段条件。

在本实施例中，针对历史用户分群和萌新用户分群设定了不同的监测周期，较好的针对不同的分群的动作信息，可以覆盖各个监测周期下的所有用户，为后续对初始预测模型的训练提供了较为全面的数据，提高了模型训练的准确率。

在一实施例中，如图4所示，步骤S10之前，也即获取样本信息宽表集之前，还包括：

S06：在用户属性库中爬取与所述样本信息宽表对应的样本用户存在关联的关系人，并将各所述关系人插入关系层级确定序列中。

可以理解地，关系人可以为样本用户的亲人、朋友、同事等。关系层级确定序列用于存储等待确定关系层级的关系人，可以通过随机插入的方式将各关系人插入关系层级确定序列中。

S07：将与所述样本用户具有直接关系的关系人记录为第一关系层级，并将与所述第一关系层级的关系人存在直接关系的关系人记录为第二关系层级。

可以理解地，直接关系的关系人指的是与样本用户具有直接关联关系的关系人，示例性地，如样本用户的亲人、朋友、同事等，进而将该与样本用户具有直接关系的关系人记录为第一关系层级。进一步地，将与第一关系层级的关系人存在关联的关系人记录为第二关系层级，示例性地，如样本用户的配偶的父母、样本用户的朋友的朋友等。需要说明的是，在本实施例中仅仅只提出第一关系层级以及第二关系层级作为示例，也即还可以存在如与第二关系层级的关系人具有直接关系的关系人记录为第三关系层级，在此不再赘述。

S08：在所述关系层级确定序列中的所有所述关系人的关系层级均确定完毕之后，确定与所述样本用户的人际关系图谱构建完成。

可以理解地，在关系层级确定序列中的所有关系人的关系层级均确定完毕之后，进而形成以样本用户为中心的人际关系图谱，该人际关系图谱中包含样本用户，与样本用户关联的关系人，以及与各关系人对应的关系层级。

S09：自所述人际关系图谱中，对各个关系层级的关系人进行人群聚类，确定与所述样本用户关联的样本分群。

可以理解地，针对于每一个关系人均具有与其对应的关系人标签，该关系人标签表征该关系人电影浏览信息或者电影票购买记录，进而将具有相同购买历史，亦或者根据电影浏览信息或者电影票购买记录对每一关系人喜好的电影类型进行分类，进而对各个关系层级的关系人进行人群聚类，也即将喜好的电影类型相同的关系人分为一类，进而得到与样本用户关联的样本分群。

在一实施例中，步骤S09之后还包括：

获取与各个关系层级关联的关系权重；

对所述样本分群中各个关系人的关系层级关联的关系权重进行聚合处理，确定与各所述样本分群的样本权重。

可以理解地，关系权重是预先赋予每一个关系层级(也即上述第一关系层级、第二关系层级等)的权重，对于与样本用户具有直接关系的第一关系层级被赋予的关系权重最高，第二关系层级被赋予的权重比第一关系层级的关系权重低，也即随着关系层级的降低，关系权重越来越低。

进一步地，在获取与各个关系层级关联的关系权重之后，对各样本分群中各个关系人的关系层级关联的关系权重进行聚合处理，也即将样本分群中各个关系人对应的关系层级关联的关系权重进行叠加，亦或者加权平均等，进而确定与各样本分群的样本权重。

在一实施例中，如图5所示，提出一种信息推送方法，包括：

S70：获取目标用户的目标信息宽表；所述目标信息宽表中包含与所述目标用户关联的各目标分群对应的分群信息。

可以理解地，目标信息宽表可以通过与目标用户关联的目标分群的分群信息生成，该分群可以为与目标用户关联的目标分群的历史购买电影票的记录，亦或者在各电影票出售的APP上的浏览记录等。其中，目标用户为请求信息推送的用户。目标分群为不同电影类型喜好的分群，也即同一个目标分群中的用户喜好的电影类型是相同的，不同的目标分群之间喜好的电影类型不同。

S80：将所述目标信息宽表输入至信息推送模型中，根据各所述目标分群对应的分群信息，对各所述目标分群进行意愿预测，确定与各所述目标分群对应的目标预测分值；所述信息推送模型是根据上述信息推送模型训练方法生成的。

具体地，在获取目标用户的目标信息宽表之后，将目标信息宽表输入至信息推送模型中，根据各所述目标分群对应的分群信息，对各所述目标分群进行意愿预测，确定与各所述目标分群对应的目标预测分值。可以理解地，该目标预测分值为信息推送模型根据各目标分群的分群信息，对目标分群进行意愿预测，进而得出各目标分群的购买对应类型的电影票的意愿值。

S90：将各所述目标分群对应的目标预测分值发送至预设推荐平台，并输出各目标分群的推荐优先级顺序，以令所述预设推荐平台向各所述目标用户进行信息推送。

可以理解地，预设推荐平台为第三方平台，该预设推荐平台对各目标分群对应的目标预测分值从高到低进行排序，进而得到各目标分群推荐的优先级顺序，也即将目标预测分值高的目标分群喜好的电影类型推送至目标用户。

进一步地，该目标分群的推荐优先级顺序可以与当前上映的电影进行结合，也即在推送至目标用户之前，确定当前上映的电影中是否存在各目标分群对应的类型的电影，将存在对应类型的电影挑选出来，并比较各电影的推荐优先级，进而将推荐优先级最高的电影推送至目标用户中，进而提高信息推送的效率以及准确率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种信息推送模型训练装置，该信息推送模型训练装置与上述实施例中信息推送模型训练方法一一对应。如图6所示，该信息推送模型训练装置包括信息宽表获取模块10、分群意愿预测模块20、样本权重调整模块30、预测损失值确定模块40、总损失值确定模块50和参数更新迭代模块60。各功能模块详细说明如下：

信息宽表获取模块10，用于获取样本信息宽表集；所述样本信息宽表集包含至少一个样本信息宽表；所述样本信息宽表关联至少一个样本分群；一个所述样本分群均关联一个样本分群分值以及一个样本权重；

分群意愿预测模块20，用于将所述样本信息宽表输入至包含初始参数的初始预测模型，以根据所述样本信息宽表对各所述样本分群进行意愿预测，确定与各所述样本分群对应的分群预测分值；

样本权重调整模块30，用于运用注意力机制技术，根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值，调整与该样本分群关联的样本权重；

预测损失值确定模块40，用于根据与同一样本分群对应的调整后的样本权重、分群标签分值以及分群预测分值，确定与该样本分群的预测损失值；

总损失值确定模块50，用于将各所述样本分群对应的预测损失值输入至总损失函数中，以确定所述初始预测模型的总损失值；

参数更新迭代模块60，用于在所述总损失值未达到预设的收敛条件时，更新迭代所述初始预测模型的初始参数，直至所述总损失值达到所述预设的收敛条件时，将收敛之后的所述初始预测模型记录为信息推送模型。

优选地，如图7所示，信息推送模型训练装置包括：

历史动作信息获取模块01，用于获取多个样本用户的历史动作信息，并确定所述历史动作信息的信息数量；

用户分群模块02，用于根据所述信息数量，将各所述样本用户分为历史用户分群以及萌新用户分群；

监测信息获取模块03，用于在第一监测周期中，获取所述历史用户分群中各历史样本用户的第一监测信息；同时，在第二监测周期中，获取所述萌新用户分群中各萌新样本用户的第二监测信息；

信息校验模块04，用于执行hive sql脚本对所述第一监测信息以及所述第二监测信息进行信息校验，得到与所述第一监测信息对应的历史特征信息，以及与所述第二监测信息对应的萌新特征信息；

特征信息预处理模块05，用于对所述历史特征信息进行预处理，得到与所述历史样本用户对应的历史样本信息宽表；同时，对所述萌新特征信息进行预处理，得到与所述萌新样本用户对应的萌新样本信息宽表。

优选地，特征信息预处理模块包括：

冗余特征监测单元，用于对所述历史特征信息进行冗余特征检测，在所述历史特征信息中包括冗余特征时，剔除包含所述冗余特征的历史特征信息，并将剔除后的历史特征信息记录为剔除特征信息；

热力图展示单元，用于对同一历史特征标签的剔除特征信息进行热力图展示，确定各所述剔除特征信息之间的特征重合率；

特征相关值确定单元，用于在所述特征重合率大于或等于预设重合阈值时，确定各所述剔除特征信息与所述历史特征标签之间的特征相关值；

特征信息剔除单元，用于剔除除特征相关值最大的剔除特征信息之外的其它剔除特征信息之后，得到所述历史样本信息宽表。

优选地，如图8所示，信息推送模型训练装置还包括：

关系人爬取模块06，用于在用户属性库中爬取与所述样本信息宽表对应的样本用户存在关联的关系人，并将各所述关系人插入关系层级确定序列中；

关系层级确定模块07，用于将与所述样本用户具有直接关系的关系人记录为第一关系层级，并将与所述第一关系层级的关系人存在直接关系的关系人记录为第二关系层级；

人机关系图谱构建模块08，用于在所述关系层级确定序列中的所有所述关系人的关系层级均确定完毕之后，确定与所述样本用户的人际关系图谱构建完成；

人群聚类模块09，用于自所述人际关系图谱中，对各个关系层级的关系人进行人群聚类，确定与所述样本用户关联的样本分群。

优选地，信息推送模型训练装置还包括：

关系权重获取模块，用于获取与各个关系层级关联的关系权重；

权重聚合模块，用于对所述样本分群中各个关系人的关系层级关联的关系权重进行聚合处理，确定与各所述样本分群的样本权重。

关于信息推送模型训练装置的具体限定可以参见上文中对于信息推送模型训练方法的限定，在此不再赘述。上述信息推送模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一实施例中，提出一种信息推送装置，包括：

目标宽表获取模块70，用于获取目标用户的目标信息宽表；所述目标信息宽表中包含与所述目标用户关联的各目标分群对应的分群信息；

意愿预测模块80，用于将所述目标信息宽表输入至信息推送模型中，根据各所述目标分群对应的分群信息，对各所述目标分群进行意愿预测，确定与各所述目标分群对应的目标预测分值；所述信息推送模型是根据上述信息推送模型训练方法生成的；

信息推送模块90，用于将各所述目标分群对应的目标预测分值发送至预设推荐平台，并输出各目标分群推荐的优先级顺序，以令所述预设推荐平台向各所述目标用户进行信息推送。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述实施例中信息推送模型训练方法，或者信息推送所使用到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息推送模型训练方法，或者该计算机程序被处理器执行时以实现一种信息推送方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中的信息推送模型训练方法，或者处理器执行计算机程序时实现上述实施例中的信息推送方法。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中信息推送模型训练方法，或者计算机程序被处理器执行时实现上述实施例中信息推送方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种信息推送模型训练方法，其特征在于，包括：

根据与同一样本分群对应的调整后的样本权重、样本分群分值以及分群预测分值，确定与该样本分群的预测损失值；

2.如权利要求1所述的信息推送模型训练方法，其特征在于，所述获取样本信息宽表集之前，包括：

获取多个样本用户的历史动作信息，并确定所述历史动作信息的信息数量；

根据所述信息数量，将各所述样本用户分为历史用户分群以及萌新用户分群；

在第一监测周期中，获取所述历史用户分群中各历史样本用户的第一监测信息；同时，在第二监测周期中，获取所述萌新用户分群中各萌新样本用户的第二监测信息；

执行hive sql脚本对所述第一监测信息以及所述第二监测信息进行信息校验，得到与所述第一监测信息对应的历史特征信息，以及与所述第二监测信息对应的萌新特征信息；

对所述历史特征信息进行预处理，得到与所述历史样本用户对应的历史样本信息宽表；同时，对所述萌新特征信息进行预处理，得到与所述萌新样本用户对应的萌新样本信息宽表。

3.如权利要求2所述的信息推送模型训练方法，其特征在于，所述历史特征信息关联一个历史特征标签；所述对所述历史特征信息进行预处理，得到与所述历史样本用户对应的历史样本信息宽表，包括：

对所述历史特征信息进行冗余特征检测，在所述历史特征信息中包括冗余特征时，剔除包含所述冗余特征的历史特征信息，并将剔除后的历史特征信息记录为剔除特征信息；

对同一历史特征标签的剔除特征信息进行热力图展示，确定各所述剔除特征信息之间的特征重合率；

在所述特征重合率大于或等于预设重合阈值时，确定各所述剔除特征信息与所述历史特征标签之间的特征相关值；

剔除除特征相关值最大的剔除特征信息之外的其它剔除特征信息之后，得到所述历史样本信息宽表。

4.如权利要求1所述的信息推送模型训练方法，其特征在于，所述获取样本信息宽表集之前，还包括：

在用户属性库中爬取与所述样本信息宽表对应的样本用户存在关联的关系人，并将各所述关系人插入关系层级确定序列中；

将与所述样本用户具有直接关系的关系人记录为第一关系层级，并将与所述第一关系层级的关系人存在直接关系的关系人记录为第二关系层级；

在所述关系层级确定序列中的所有所述关系人的关系层级均确定完毕之后，确定与所述样本用户的人际关系图谱构建完成；

自所述人际关系图谱中，对各个关系层级的关系人进行人群聚类，确定与所述样本用户关联的样本分群。

5.如权利要求4所述的信息推送模型训练方法，其特征在于，所述确定与所述样本用户关联的样本分群之后，包括：

获取与各个关系层级关联的关系权重；

6.一种信息推送方法，其特征在于，包括：

将所述目标信息宽表输入至信息推送模型中，根据各所述目标分群对应的分群信息，对各所述目标分群进行意愿预测，确定与各所述目标分群对应的目标预测分值；所述信息推送模型是根据如权利要求1至5任一项所述的信息推送模型训练方法生成的；

7.一种信息推送模型训练装置，其特征在于，包括：

8.一种信息推送装置，其特征在于，包括：

意愿预测模块，用于将所述目标信息宽表输入至信息推送模型中，根据各所述目标分群对应的分群信息，对各所述目标分群进行意愿预测，确定与各所述目标分群对应的目标预测分值；所述信息推送模型是根据如权利要求1至5任一项所述的信息推送模型训练方法生成的；

信息推送模块，用于将各所述目标分群对应的目标预测分值发送至预设推荐平台，并输出各目标分群的推荐优先级顺序，以令所述预设推荐平台向各所述目标用户进行信息推送。

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述信息推送模型训练方法，或者所述处理器执行所述计算机程序时实现如权利要求6所述信息推送方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述信息推送模型训练方法，或者所述计算机程序被处理器执行时实现如权利要求6所述信息推送方法。