CN111881343A

CN111881343A - 信息推送方法、装置、电子设备及计算机可读存储介质

Info

Publication number: CN111881343A
Application number: CN202010649266.4A
Authority: CN
Inventors: 李森林
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Shenzhen Hefei Technology Co ltd
Priority date: 2020-07-07
Filing date: 2020-07-07
Publication date: 2020-11-03

Abstract

本申请实施例公开了一种信息推送方法、装置、电子设备及计算机可读存储介质。该方法包括：获取候选的目标推送信息、在一定时长内目标用户的行为数据，以及获取目标用户与目标推送信息关联的历史浏览记录，其中，行为数据包括应用行为数据及搜索行为数据；通过推送模型对目标推送信息、行为数据及历史浏览记录进行分析，得到推荐模型预测的期望曝光时长，其中，推送模型为通过推送信息样本以及与推送信息样本对应的用户历史数据训练得到的；根据期望曝光时长确定目标用户对于目标推送信息的兴趣程度。上述信息推送方法、装置、电子设备及计算机可读存储介质，能够准确向用户推送用户感兴趣的信息，提高了信息推送的准确性。

Description

信息推送方法、装置、电子设备及计算机可读存储介质

技术领域

本申请涉及数据处理技术领域，具体涉及一种信息推送方法、装置、电子设备及计算机可读存储介质。

背景技术

随着计算机技术的高速发展，电子设备也越来越智能化。为了满足用户对信息的获取需求，电子设备会向用户推送各种信息，例如，向用户推送各式的广告信息、视频信息、新闻信息等。如何准确向用户推送用户感兴趣的信息成为当下研究的热点。

发明内容

本申请实施例公开了一种信息推送方法、装置、电子设备及计算机可读存储介质，能够准确向用户推送用户感兴趣的信息，提高了信息推送的准确性。

本申请实施例公开一种信息推送方法，包括：获取候选的目标推送信息、在一定时长内目标用户的行为数据，以及获取所述目标用户与所述目标推送信息关联的历史浏览记录，其中，所述行为数据包括应用行为数据及搜索行为数据；通过推送模型对所述目标推送信息、行为数据及历史浏览记录进行分析，得到所述推荐模型预测的期望曝光时长，其中，所述推送模型为通过推送信息样本以及与所述推送信息样本对应的用户历史数据训练得到的，所述用户历史数据包括用户在一定时长内的行为数据，以及包括与所述推送信息样本关联的历史浏览记录；根据所述期望曝光时长确定所述目标用户对于所述目标推送信息的兴趣程度。

本申请实施例公开一种信息推送装置，包括：数据获取模块，用于获取候选的目标推送信息、在一定时长内目标用户的行为数据，以及获取所述目标用户与所述目标推送信息关联的历史浏览记录，其中，所述行为数据包括应用行为数据及搜索行为数据；预测模块，用于通过推送模型对所述目标推送信息、行为数据及历史浏览记录进行分析，得到所述推荐模型预测的期望曝光时长，其中，所述推送模型为通过推送信息样本以及与所述推送信息样本对应的用户历史数据训练得到的，所述用户历史数据包括用户在一定时长内的行为数据，以及包括与所述推送信息样本关联的历史浏览记录；兴趣确定模块，用于根据所述期望曝光时长确定所述目标用户对于所述目标推送信息的兴趣程度。

本申请实施例公开一种电子设备，包括存储器及处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器实现如上所述的信息推送方法。

本申请实施例公开一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的信息推送方法。

本申请实施例公开的信息推送方法、装置、电子设备及计算机可读存储介质，通过推送模型对候选的目标推送信息、在一定时长内目标用户的应用行为数据、搜索行为数据，以及历史浏览记录进行分析，得到推荐模型预测目标推送信息的期望曝光时长，再根据该期望曝光时长确定目标用户对于目标推送信息的兴趣程度，推荐模型能够结合目标推送信息、用户的应用使用行为、搜索行为及历史浏览记录四个方面，分析预测得到期望曝光时长，可更加真实地反映目标用户对目标推送信息的兴趣，从而可以准确向用户推送用户感兴趣的信息，提高了信息推送的准确性，还可以避免信息推送不准确造成的资源浪费。

本申请实施例公开一种推送模型的训练方法，包括：获取推送信息样本及与所述推送信息样本对应的用户历史数据，所述用户历史数据包括用户在一定时长内的应用行为数据、用户在所述一定时长内的搜索行为数据，以及包括与所述推送信息样本关联的历史浏览记录；根据所述推送信息样本和用户历史数据对推送模型进行训练，得到训练后的推送模型，所述训练后的推送模型预测的所述推送信息样本的期望曝光时长与所述推送信息样本的实际曝光时长之间的误差值满足精度条件。

本申请实施例公开一种推送模型的训练装置，包括：样本获取模块，用于获取推送信息样本及与所述推送信息样本对应的用户历史数据，所述用户历史数据包括用户在一定时长内的应用行为数据、用户在所述一定时长内的搜索行为数据，以及包括与所述推送信息样本关联的历史浏览记录；训练模块，用于根据所述推送信息样本和用户历史数据对推送模型进行训练，得到训练后的推送模型，所述训练后的推送模型预测的所述推送信息样本的期望曝光时长与所述推送信息样本的实际曝光时长之间的误差值满足精度条件。

本申请实施例公开一种电子设备，包括存储器及处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器实现如上所述的推送模型的训练方法。

本申请实施例公开一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的推送模型的训练方法。

本申请实施例公开的推送模型的训练方法、装置、电子设备及计算机可读存储介质，通过将推送信息样本、用户在一定时长内的应用行为数据、用户在一定时长内的搜索行为数据，以及与推送信息样本关联的历史浏览记录四个方面作为推送模型的输入，并将推送信息样本的曝光时长作为目标对推送模型进行训练，使得训练后的推送模型能够准确预测用户对推送信息的期望曝光时长，可更加真实地反映目标用户对推送信息的兴趣，从而可以准确向用户推送用户感兴趣的信息，提高了信息推送的准确性，还可以避免信息推送不准确造成的资源浪费。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为一个实施例中信息推送方法及推送模型的训练方法的应用场景图；

图2为一个实施例中信息推送方法的流程图；

图3为一个实施例中通过推送模型预测目标推送信息的期望曝光时长的流程图；

图4A为一个实施例中通过推送模型预测得到目标推送信息的期望曝光时长的示意图；

图4B为一个实施例中推送模型的模型架构示意图；

图5为另一个实施例中信息推送方法的流程图；

图6为一个实施例中推送模型的训练方法的流程图；

图7为一个实施例中对推送模型进行训练的流程图；

图8为一个实施例中信息推送装置的框图；

图9为一个实施例中推送模型的训练装置的框图；

图10为一个实施例中电子设备的结构框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请实施例及附图中的术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

目前向用户推送信息的方式可主要包括三种：1、基于推送内容进行信息推荐；2、基于协同过滤进行信息推荐；3、基于关联规则进行信息推荐。

其中，基于推送内容进行信息推荐是建立在推送内容的信息上做出推荐，推送内容和推送对象(即用户)是通过相关的历史数据特征属性来定义的，而不需要对推送对象本身进行刻画。通常，这种推送方式通过预测点击率来进行模型训练，目标函数是优化点击率。这种方式忽略了点击率和用户真实兴趣之间的关系，不同推送内容的点击率相同的情况下不代表用户对每条推送内容的兴趣程度是相同的。

基于协同过滤进行信息推荐是利用用户的历史喜好信息计算不同用户之间的距离，然后基于推送对象的最近邻用户对推送内容的点击率来该推送对象是否会点击推送内容。协同过滤考虑了用户本身的刻画，然而鉴于个人数据隐私保护的逐渐盛行，移动端用户的基本信息获取及KYC(Know your customer，充分了解客户)认证变得越来越难，例如，用户的性别、年龄、收入状况，婚姻状况等信息不能从移动端直接获取，因此不足以支撑对用户本身的显性刻画。

基于关联规则进行信息推荐则是以关联规则为基础，通过历史数据统计不同规则出现的关系，例如用户点击了推送内容A后有一定的概率也会点击推送内容B。该方法同样忽略了点击率和用户真实兴趣之间的关系，从而使得推送内容不准确，造成资源浪费。

图1为一个实施例中信息推送方法及推送模型的训练方法的应用场景图。如图1所示，服务器20可与终端设备10通过网络建立通信连接。终端设备10可采集用户的数据上传至服务器20，可包括采集用户与推送信息相关的数据并上传至服务器20。

服务器20可获取推送信息样本及与推送信息样本对应的用户历史数据对推送模型进行训练，其中，用户历史数据包括用户在一定时长内的应用行为数据、用户在一定时长内的搜索行为数据，以及包括与推送信息样本关联的历史浏览记录。服务器20可将推送信息样本、用户在一定时长内的应用行为数据、用户在一定时长内的搜索行为数据，以及与推送信息样本关联的历史浏览记录四个方面作为推送模型的输入，并将推送信息样本的曝光时长作为目标对推送模型进行训练。在进行信息推送时，可通过已经训练好的推送模型预测目标用户对候选的目标推送信息的期望曝光时长，从而基于该期望曝光时长确定目标用户对于目标推送信息的兴趣程度。服务器20可向目标用户的终端设备10推送兴趣程度较高的推送信息。

可以理解地，上述的终端设备10可包括但不限于手机、平板电脑、智能穿戴设备、个人计算机(Personal Computer，PC)等，服务器20可以是单独的服务器设备，也可以是包括有多个服务器设备的服务器集群，还可以是云端的服务器等，本申请实施例不作限定。

如图2所示，在一个实施例中，提供一种信息推送方法，可应用于电子设备，该电子设备可以是上述的终端设备，也可以是上述的服务器。该信息推送方法可包括以下步骤：

步骤210，获取候选的目标推送信息、在一定时长内目标用户的行为数据，以及获取目标用户与目标推送信息关联的历史浏览记录，其中，行为数据包括应用行为数据及搜索行为数据。

目标推送信息为候选的推送信息，指的是准备向推送对象推送的信息。可选地，推送信息可包括但不限于视频信息、图片信息、文字信息等，推送信息可包括多种信息类型，例如，可包括但不限于新闻实事、娱乐、生活、教育、投资理财等。推送信息的推送方式也可以有多种，例如以短信的方式推送、应用程序通过弹窗的消息推送、访问的页面中的窗口内容推送等，但不限于此。

目标用户可指的是待进行信息推送的推送对象。电子设备可获取在一定时长内目标用户的行为数据，可包括目标用户在一定时长内的应用行为数据，以及在一定时长内的搜索行为数据，其中，应用行为数据指的是使用应用的数据，可包括使用的应用标识以及使用时刻、使用时长等数据，搜索行为数据指的是在浏览器或应用程序等中进行搜索的数据，可包括搜索关键词、搜索时刻等数据。可选地，上述的一定时长可根据实际需求进行设置，例如1天、4小时、2天等。获取的应用行为数据对应的时长与获取的搜索行为数据对应的时长可相同，也可不同。例如，可获取用户在12个小时内的应用行为数据及搜索行为数据，也可获取用户在12个小时内的应用行为数据以及在24小时的搜索行为数据等。

电子设备还可获取与目标推送信息关联的历史浏览记录。可选地，电子设备可先获取目标用户针对推送信息的历史浏览记录，该针对推送信息的历史浏览记录可以是目标用户的所有历史浏览记录，也可以是某个时间段的历史浏览记录，历史浏览记录可包括用户点击每个推送信息的信息内容、点击时刻，以及浏览点击的推送信息的时长等。

可从目标用户针对推送信息的历史浏览记录中选取与目标推送信息关联的历史浏览记录。作为一种实施方式，与目标推送信息关联的历史浏览记录可包括针对与目标推送信息属于相同信息类型的推送信息的历史浏览记录，例如，目标推送信息属于新闻实事，则可获取目标用户针对属于新闻实事的推送信息的历史浏览记录。作为另一种实施方式，与目标推送信息关联的历史浏览记录可包括与目标推送信息属于同一应用程序的推送信息的历史浏览记录。例如，目标推送信息为应用A的推送信息，则可获取目标用户针对应用A的推送信息的历史浏览记录。作为另一种实施方式，与目标推送信息关联的历史浏览记录可包括与目标推送信息属于相同数据种类的历史浏览记录。例如，目标推送信息为视频数据，则可获取目标用户针对属于视频数据的推送信息的历史浏览记录等。可以理解地，与目标推送信息关联的历史浏览记录可以为上述中的一种或多种，也可以是其它关联的浏览记录，在此不作限定。

在一个实施例中，电子设备可定时采集不同终端设备上与推送信息相关的用户历史数据并存储在数据库中，用户历史数据可包括上述的行为数据、历史浏览记录等。可选地，在需要进行信息推送时，电子设备可获取目标用户的用户标识，该用户标识可包括但不限于目标用户的身份证号、电话号码、对应终端设备的媒体介入控制层(Media AccessControl，MAC)地址等。可根据目标用户的用户标识，在数据库中查找与该用户标识匹配的用户历史数据，从而得到上述的在一定时长内目标用户的行为数据、目标用户与目标推送信息关联的历史浏览记录等数据。

步骤220，通过推送模型对目标推送信息、行为数据及历史浏览记录进行分析，得到推荐模型预测的期望曝光时长。

推送模型可为通过推送信息样本以及与推送信息样本对应的用户历史数据训练得到的模型，可选地，推送模型可以是以卷积神经网络(Convolutional Neural Networks,CNN)、感知器神经网络、BP(back propagation)神经网络等模型为基础进行训练得到的模型，但不限于此。与推送信息样本对应的用户历史数据可指的是与推送信息样本属于同一用户的用户历史数据，例如，推送信息样本为用户A浏览过的推送信息，则可对应用户A的用户历史数据。

为了更加准确地反映用户对推送信息的真实兴趣程度，在本申请实施例中，可将推送信息的曝光时长作为重要的参考依据，推送信息的曝光时长可指的是用户浏览推送信息的时长。可将推送信息样本以及与推送信息样本对应的用户历史数据作为推送模型的输入数据，并以推送信息样本的曝光时长为目标对推送模型中的参数进行训练，以使得训练得到的推送模型针对某条推送信息样本输出的期望曝光时长与该推送信息样本的实际曝光时长接近。训练得到的推送模型可更加真实、准确地反映用户对推送信息的兴趣程度，且采集的样本数据不会涉及到用户的隐私信息，降低了信息采集的难度，也保障了用户信息的安全性。

可选地，推送模型的模型架构可至少包括输入层、隐藏层及输出层，可将目标推送信息、目标用户的行为数据及与该目标推送信息关联的历史浏览记录输入推送模型的输入层中，并通过隐藏层对输入的数据进行分析，最后推送模型的输出层可输出目标用户对于目标推送信息的期望曝光时长。

步骤230，根据期望曝光时长确定目标用户对于目标推送信息的兴趣程度。

在一些实施例中，推送模型预测的目标推送信息的期望曝光时长可与目标用户对于目标推送信息的兴趣程度呈正相关关系，期望曝光时长越长，可确定目标用户对目标推送信息的兴趣程度越高。

作为一种具体实施方式，可预先划分多个时长区间，每个时长区间可分别包括不同的时间数值，每个时长区间可分别对应不同的兴趣等级，兴趣等级越高，可表示兴趣程度越高。可确定推送模型输出的期望曝光时长所处的时长区间，并获取该所处的时长区间对应的兴趣等级，确定目标用户对目标推送信息的兴趣程度。例如，可包括3个时长区间[0，3]，[3，6]，[6，10]，其中，[0，3]对应的兴趣等级为1级，兴趣程度为低，[3，6]对应的兴趣等级为2级，兴趣程度为中，[6，10]对应的兴趣等级为3级，兴趣程度为高。可选地，不同数据类型的推送信息可分别对应不同的时长区间，例如，视频数据类型的推送信息对应的时长区间的数量可多于图片数据类型的推送信息对应的时长区间的数量，且视频数据类型的推送信息对应的时长区间包括的时间数值与图片数据类型的推送信息对应的时长区间所包括的时间数值也可不同。

作为另一种具体的实施方式，可获取目标推送信息对应的完整曝光时长，该完整曝光时长可指的是用户浏览完目标推送信息所需的时长。可计算推送模型输出的期望曝光时长占完整曝光时长的比例，并根据该比例确定目标用户对于目标推送信息的兴趣程度。

可选地，期望曝光时长占完整曝光时长的比例越大，兴趣程度可越高。可选地，目标推送信息对应的完整曝光时长可以是预设的固定时长，完整曝光时长可根据目标推送信息的数据类型、包含的信息量等确定，例如，视频数据类型的推送信息的完整曝光时长可大于文字类型的推送信息的完整曝光时长，包含文字越多的推送信息的完整曝光时长可越长等。也可根据用户的浏览速度确定目标推送信息对应的完整曝光时长，可获取用户浏览与目标推送信息属于相同数据类型的推送信息的浏览速度，并根据该浏览速度及目标推送信息包含的信息量确定完整曝光时长，可选地，完整曝光时长可为目标推送信息包含的信息量与浏览速度的比值。

可以理解地，根据期望曝光时长确定目标用户对目标推送信息的兴趣程度的方式也可以是其它方式，并不仅限于上述几种方式。

在本申请实施例中，通过推送模型对候选的目标推送信息、在一定时长内目标用户的应用行为数据、搜索行为数据，以及历史浏览记录进行分析，得到推荐模型预测目标推送信息的期望曝光时长，再根据该期望曝光时长确定目标用户对于目标推送信息的兴趣程度，推荐模型能够结合目标推送信息、用户的应用使用行为、搜索行为及历史浏览记录四个方面，分析预测得到期望曝光时长，可更加真实地反映目标用户对目标推送信息的兴趣，从而可以准确向用户推送用户感兴趣的信息，提高了信息推送的准确性，还可以避免信息推送不准确造成的资源浪费。

如图3所示，在一个实施例中，步骤通过推送模型对目标推送信息、行为数据及历史浏览记录进行分析，得到推荐模型预测的期望曝光时长，可包括以下步骤：

步骤302，通过特征提取模型分别提取目标推送信息的第一特征、应用行为数据的第二特征、搜索行为数据的第三特征，以及历史浏览记录的第四特征。

推送模型可包括特征提取模型和期望预测模型，特征提取模型可用于提取目标推送信息、用户在一定时长内的行为数据、及历史浏览记录的特征，并将提取的特征作输入至期望预测模型中，期望预测模型则可用于对输入的特征进行分析后，预测得到期望曝光时长。

在一些实施例中，特征提取模型可包括第一神经网络，第一神经网络可用于提取目标推送信息的第一特征，第一神经网络是根据推送信息样本序列训练得到的，推送信息样本序列中可包括多个推送信息样本。可选地，推送信息样本序列可包括多个推送信息样本的信息标识，信息标识可包括但不限于推送信息样本的编号，例如，推送信息样本序列为push1、push2、push3，其中，push1、push2、push3分别对应3个不同的推送信息。

可选地，第一神经网络可以是Word2vec模型，Word2vec模型是用于产生词向量的相关模型，可将输入的每个词映射到一个向量，该映射的向量即为词的特征。第一神经网络在进行训练时，可将推送信息样本序列当作一条句子，而推送信息样本序列包括的每个推送信息样本的信息标识作为一个词，从而将每个推送信息样本的信息标识映射到第一高维空间中，得到每个信息标识对应的向量特征，即embedding(嵌入向量化)特征。信息标识对应的向量特征即可作为该信息标识对应的推送信息样本的向量特征。可选地，第一高维空间的维度可根据实际需求进行设定，例如100维、50维、68维等，在此不作限定。可通过大量的推送信息样本对第一神经网络进行训练，训练后的第一神经网络可相当于是一个大型的推送信息库，包括了不同推送信息分别对应的向量特征，在第一神经网络中，相似的推送信息的向量特征之间的距离可较小。

电子设备可获取目标推送信息的信息标识，该信息标识可以是目标推送信息的编号，并通过第一神经网络将目标推送信息的信息标识映射到第一高维空间，得到目标推送信息的第一向量特征，可将该第一向量特征作为目标推送信息的第一特征。可选地，获取的目标推送信息的信息标识可与第一神经网络在训练时输入的推送信息样本序列所包括的信息标识属于相同类型，以保证得到的第一向量特征更为准确。

在一些实施例中，特征提取模型可包括第二神经网络，第二神经网络可用于提取目标用户在一定时长内的应用行为数据的第二特征。第二神经网络可以是根据大量用户在一定时长内的应用行为数据训练得到的，用于训练第二神经网络的每份应用行为数据可包括用户在一定时长内使用过的应用的应用标识，可选地，应用标识可包括但不限于应用编号、应用名称等，例如，用户A在一定时长内使用过的应用包括APP_0，APP_1、APP_0、APP_4等。

可选地，第二神经网络也可以是Word2vec模型，第二神经网络在进行训练时，可将输入的每份应用行为数据当作一条句子，而应用行为数据包括的每个应用的应用标识作为一个词，从而将每个应用的应用标识映射到第二高维空间中，得到每个应用对应的embedding特征。可选地，第二高维空间的维度可根据实际需求进行设定，例如120维、100维等，在此不作限定。在第二神经网络中，相似的应用的向量特征之间的距离可较小。

电子设备可通过第二神经网络提取目标用户的应用行为数据的第二特征。可根据目标用户的应用行为数据获取应用使用序列，该应用使用序列可包括目标用户在一定时长内，按照使用时刻的先后顺序依次排列的应用。可通过第二神经网络将该应用使用序列中包含的各个应用映射到第二高维空间，进一步地，可通过第二神经网络将该应用使用序列中包含的各个应用的应用标识映射到第二高维空间，得到应用使用序列中包含的每个应用的向量特征。

在一些实施例中，由于应用行为数据中通常会包括多个使用的应用，为了避免最终得到的应用行为数据的第二特征的维度过多，可对得到的应用使用序列中包含的每个应用的向量特征进行加权平均处理，得到应用行为数据的第二向量特征，该第二向量特征可作为应用行为数据的第二特征。例如，目标用户B一定时间内使用的App序列为App_0,App_0,App_1，通过第二神经网络可得到对应的embedding特征分别为[1，2，2]、[1，2，2]、[2，1，1]，则进行加权平均处理，可得到第二向量特征为[(1+1+2)/3，(2+2+1)/3，(2+2+1)/3]＝[4/3，5/3，5/3]。可以有效降低应用行为数据的第二向量特征的维度，避免维度爆炸，可提高后续期望预测模型预测得到的期望曝光时长的准确性。

在一些实施例中，特征提取模型可包括第三神经网络，第三神经网络可用于提取目标用户在一定时长内的搜索行为数据的第三特征。第二神经网络可以是根据大量用户在一定时长内的搜索行为数据训练得到的，可提取每份搜索行为数据的搜索关键词，并利用该搜索关键词对第三神经网络进行训练。可选地，第三神经网络也可以是Word2vec模型，第三神经网络在进行训练时，可将输入的每份搜索行为数据的搜索关键词当作一条句子，并将每个搜索关键词映射到第三高维空间中，得到每个搜索关键词对应的embedding特征。可选地，第三高维空间的维度可根据实际需求进行设定，例如80维、110维等，在此不作限定。在第三神经网络中，相似的搜索关键词的向量特征之间的距离可较小。

电子设备可通过第三神经网络提取目标用户的搜索行为数据的第三特征。可根据目标用户的搜索行为数据获取搜索词序列，该搜索词序列可包括目标用户在一定时长内，按照搜索时间的先后顺序依次排列的搜索关键词。可通过第三神经网络将搜索词序列中包含的各个搜索关键词映射到第三高维空间，得到搜索词序列中包含的每个搜索关键词的向量特征。再对每个搜索关键词的向量特征进行加权平均处理，得到搜索行为数据的第三向量特征，该第三向量特征可作为搜索行为数据的第三特征。对搜索关键词的向量特征进行加权平均处理的方式可与上述实施例中对应用的向量特征进行加权平均处理的方式相同。可以有效降低搜索行为数据的第三向量特征的维度，避免维度爆炸，可提高后续期望预测模型预测得到的期望曝光时长的准确性。

可选地，上述的第一神经网络、第二神经网络及第三神经网络可相互独立，彼此之间的数据不会相互影响。可以理解地，第一神经网络、第二神经网络及第三神经网络也可以是除了Word2vec模型以外的其它神经网络模型，在此不作限定。

在一些实施例中，目标用户的历史浏览记录的第四特征可以是数值型特征。提取目标用户与目标推送信息关联的第四特征，获取目标推送信息所属的信息类型，根据历史浏览记录获取最近浏览时刻距离当前时刻的第一时长，并根据历史浏览记录获取第二时长，再分别对第一时长及第二时长进行非线性变化，得到非线性数值特征，可将第一时长、第二时长及非线性数值特征作为第四特征。

最近浏览时刻可指的是目标用户最近一次浏览属于该获取的信息类型的推送信息的时刻，即最近一次浏览与目标推送信息属于相同信息类型的推送信息的时刻。例如，目标推送信息的信息类型为投资理财，则可获取目标用户最近一次浏览投资理财类型的推送信息的时刻。

第二时长指的是目标用户浏览属于该获取的信息类型的推送信息的历史最大时长，即浏览与目标推送信息属于相同信息类型的推送信息的历史最大时长。可获取目标用户每次浏览与目标推送信息属于相同信息类型的推送信息的浏览时长，并进行排序，从中获取最大的浏览时长作为第二时长。例如，目标推送信息的信息类型为教育类型，则可获取目标用户每次浏览教育类型的推送信息的浏览时长，并从中获取最大的浏览时长。

在一些实施例中，除了将第一时长和第二时长作为历史浏览记录的特征以外，还可分别对第一时长及第二时长进行非线性变化，可选地，非线性变化可包括指数变化、底数变化等，例如，第一时长为x，则进行非线性变化可为xⁿ、x^1/n等，其中，n可以是预先设置的超参数，例如n为2等，但不限于此，n的具体数据可根据实验结果进行设置。可将第一时长及第二时长进行非线性变化后得到的非线性数值作为非线性数值特征，并将第一时长、第二时长及非线性数值特征作为第四特征。通过对第一时长、第二时长等数值型变量进行非线性变化，可有效地引入特征的非线性衍生，可使得后续期望预测模型预测得到的期望曝光时长更为准确。

步骤304，将第一特征、第二特征、第三特征及第四特征进行拼接，得到目标特征。

在一些实施例中，可将上述得到的第一向量特征、第二向量特征、第三向量特征及第四特征连接，得到目标特征。例如，第一向量特征为[1，2，3]，第二向量特征为[4，5，6]，第三向量特征为[7，8，9]，第四特征为[x，xⁿ，x^1/n，y，yⁿ]，则可拼接得到目标特征为[1，2，3，4，5，6，7，8，9，x，xⁿ，x^1/n，y，yⁿ]。

步骤306，通过期望预测模型对目标特征进行分析，得到预测的期望曝光时长。

可将目标特征输入到期望预测模型中，通过期望预测模型对目标特征进行分析，得到预测的目标推送信息的期望曝光时长。在一些实施例中，期望预测模型的模型架构可包括输入层、多个全连接层及输出层，每个全连接层中的各个节点都会连接下一层全连接层的所有节点。电子设备可通过期望预测模型的多个全连接层将目标特征映射到固定维度的空间，得到目标特征在固定维度的空间中的输出特征。可选地，每层全连接层的规格可不同，即可包括不同的节点数量，例如，第一层全连接层包括512个节点，第二层全连接层包括256个节点，第三层全连接层包括128个节点，但不限于此。可选地，期望预测模型包含的各个全连接层可逐级递减，输入的目标特征经过每层全连接层的计算后，可降低一定的维度，例如，输入的目标特征为1246维的特征，经过第一层全连接层后输出的特征变为512维，经过第二层全连接层后输出的特征变为256维，经过第三层全连接层后输出的特征变为128维等。目标特征经过多个全连接层的映射后输出的输出特征可为固定维度的特征，该输出特征包含的特征数量与该固定维度相同。例如，最后一层全连接层输出的特征为128维，则输出特征可包括128个特征。

通过期望预测模型的全连接层得到的输出特征可输入到输出层，输出层可包括逻辑回归函数，逻辑回归函数可包括与输出特征的各个特征一一对应的权重系数，例如，输出特征包括128个特征，则逻辑回归函数中可包括128个权重系数，并分别与输出特征中的各个特征对应。可根据期望预测模型的逻辑回归函数中包含的权重系数计算输出特征对应的期望曝光时长，其中，期望曝光时长是通过以自然常数为底数，以输出特征及权重系数的加权和为对数计算得到的。

在一些实施例中，基于逻辑回归的定义，可得到公式(1)：

ln(odd)＝Wx+b式(1)；

其中，odd可用于表示期望曝光时长，W和b均为超参数，W为权重系数，b为偏执系数，x则为输出特征。因此，计算期望曝光时长的方式可如式(2)所示：

odd＝e^Wx+b式(2)。

通过式(2)可计算得到目标推送信息的期望曝光时长，其中的权重系数W和偏执系数b可在期望预测模型的训练过程中不断进行调整。

图4A为一个实施例中通过推送模型预测得到目标推送信息的期望曝光时长的示意图。如图4A所示，推送模型可包括特征提取模型410及期望预测模型420，可将目标推送信息、目标用户在一定时长内的应用行为数据、搜索数据，以及目标用户与目标推送信息关联的历史浏览记录输出特征提取模型410。特征提取模型410可分别提取目标推送信息、目标用户在一定时长内的应用行为数据、搜索数据及历史浏览记录的特征，电子设备可对特征提取模型410提取的特征进行拼接，得到目标特征，并将目标特征输入期望预测模型420。期望预测模型420可对目标特征进行分析，并输出目标推送信息的期望曝光时长。

图4B为一个实施例中推送模型的模型架构示意图。如图4B所示，推送模型可包括特征提取模型410及期望预测模型420，特征提取模型410可包括相互独立的第一神经网络412、第二神经网络414、第三神经网络416。可通过第一神经网络412提取输入的目标推送信息的第一特征，通过第二神经网络414提取输入的目标用户的应用行为数据包含的各个应用的向量特征，并进行加权平均处理后得到应用行为数据的第二特征，通过第三神经网络416提取输入的目标用户的搜索行为数据包含的各个搜索关键词的向量特征，并进行加权平均处理后得到搜索行为数据的第四特征。可获取目标用户的历史浏览记录中距离上一次浏览与目标推送信息属于相同信息类型的推送信息的第一时长，以及浏览与目标推送信息属于相同信息类型的推送信息的历史最大时长，并对该第一时长、历史最大时长等进行非线性变化，得到目标用户的历史浏览记录的第四特征。电子设备可将第一特征、第二特征、第三特征及第四特征进行拼接，得到目标特征430。

期望预测模型420可包括输入层、多层全连接层422及输出层424，电子设备可将目标特征430输入期望预测模型420的输入层，并通过多层全连接层422将目标特征430映射到固定维度的空间，得到输出特征，并将输出特征输入输出层424。可通过输出层中的式(2)计算得到目标推送信息的期望曝光时长并输出。

在本申请实施例中，可通过推送模型的特征提取模型分别提取目标推送信息及目标用户的行为数据、历史浏览记录等的特征并进行拼接后，再通过推送模型的期望预测模型对拼接后的目标特征进行分析，得到目标推送信息的期望曝光时长，可更加真实地反映目标用户对目标推送信息的兴趣，且期望预测模型输出的期望曝光时长更为准确，提高了信息推送的准确性。

如图5所示，在一个实施例中，提供另一种信息推送方法，可应用于上述的电子设备，该方法可包括以下步骤：

步骤502，获取推送信息样本及与推送信息样本对应的用户历史数据。

步骤504，根据推送信息样本和用户历史数据对推送模型进行训练，得到训练后的推送模型。

在本申请实施例中，可根据大量的推送信息样本及与推送信息样本对应的用户历史数据对推送模型进行训练，用户历史数据包括用户在一定时长内的应用行为数据、用户在一定时长内的搜索行为数据，以及包括与推送信息样本关联的历史浏览记录。推送模型可采用逻辑回归的方式进行训练，通过构建的损失函数不断调整推送模型中的各个参数，使得损失函数最后的输出结果最小或满足预期，可选地，损失函数可用于计算输入推送模型的推送信息样本的期望曝光时长与实际曝光时长之间的误差值。

在一些实施例中，可将推送信息样本以及与推送信息样本对应的用户历史数据输入待训练的推送模型中，通过待训练的推送模型对输入的推送信息样本及用户历史数据进行分析，并根据推送模型的逻辑回归函数计算得到推送信息样本的期望曝光时长。可计算推送信息样本的期望曝光时长与推送信息样本的实际曝光时长之间的误差值。可选地，可通过损失函数计算推送信息样本的期望曝光时长与实际曝光时长之间的误差值，并判断该误差值是否满足精度条件。若不满足精度条件，可对推送模型中的各个参数进行调整，其中，调整的参数可包括逻辑回归函数中包含的权重系数及偏执系数、各个连接层的参数等。并重新执行通过待训练的推送模型对输入的推送信息样本及用户历史数据进行分析的步骤，直至误差值满足精度条件，则完成推送模型的训练。

在一些实施例中，推送模型包括特征提取模型及期望预测模型，可分别对特征提取模型及期望预测模型进行训练。作为一种实施方式，特征提取模型可包括相互独立的第一神经网络、第二神经网络及第三神经网络，则可分别对第一神经网络、第二神经网络及第三神经网络进行训练。可根据推送信息样本序列对第一神经网络进行训练，根据用户的应用行为数据对第二神经网络进行训练，并根据搜索行为数据对第三神经网络进行训练。对第一神经网络、第二神经网络及第三神经网络进行训练的训练方式可参照上述实施例中步骤302的相关描述，在此不再一一赘述。

为了验证第一神经网络训练是否完成，则可向第一神经网络输入至少两个相似的推送信息，并分别得到输入的各个推送信息的向量特征，可计算各个推送信息的向量特征之间的距离，若该距离小于距离阈值，则可说明第一神经网络的精度达到预期，第一神经网络训练完成。同理，第二神经网络及第三神经网络验证是否训练完成的方式也可类似，通过输入至少两个相似的应用到第二神经网络中，输入至少两个相似的搜索关键词到第三神经网络中，从而验证第二神经网络及第三神经网络的精度是否达到预期。

对特征提取模型训练完成后，可再对期望预测模型进行训练。可将属于同一用户标识的推送信息样本、应用行为数据、搜索行为数据以及历史浏览记录输入训练后的特征提取模型中，并通过训练后的特征提取模型分别提取属于同一用户标识的推送信息样本的第一特征、属于同一用户标识的应用行为数据的第二特征、属于同一用户标识的搜索行为数据的第三特征，以及属于同一用户标识的历史浏览记录的第四特征。可将训练后的特征提取模型输出的第一特征、第二特征、第三特征及第四特征进行拼接，得到目标特征。可将目标特征及该属于同一用户标识的推送信息样本的实际曝光时长输入到期望预测模型中，根据目标特征对期望预测模型进行训练。

例如，可将用户A浏览的推送信息1输入训练后的第一神经网络，提取得到第一特征，将用户A在一定时长内的应用行为数据输入训练后的第二神经网络，提取得到第二特征，将用户A在一定时长内的搜索行为数据输入训练后的第三神经网络，提取得到第三特征，并对用户A与推送信息1关联的历史浏览记录的第一时长、第二时长等进行非线性变化，得到第四特征。可将第一特征、第二特征、第三特征及第四特征进行拼接，得到目标特征，再将目标特征及推送信息1的实际曝光时长输入待训练的期望预测模型中，对期望预测模型进行训练。

为了使期望预测模型更加真实、准确地表达用户对推送信息的兴趣程度，在对期望预测模型进行训练时，可将推送信息样本的曝光时长作为正样本的权重，而负样本的权重为1，得到正样本对应的事件概率为：

其中，正样本指的是用户浏览过的推送信息样本，负样本指的是用户未浏览过的推送信息样本。T为推送信息样本的曝光时长，p为用户点击该推送信息样本的概率。由于在对期望预测模型进行训练时输入的是全量的推送信息样本，而某个用户从全量的推送信息样本点击其中的一条推送信息样本的概率p是个很小的值，因此可得到：

由于T为推送信息样本的曝光时长，p为用户点击该推送信息样本的概率，因此，odd可看作是用户对该推送信息样本的期望曝光时长，而基于逻辑回归的定义可得到上述的式(1)，从而可得到期望曝光时长的计算公式为上述的式(2)。

将期望预测模型进行训练的目标特征输入待训练的期望预测模型后，可通过期望预测模型的多个全连接层将该目标特征映射到固定维度的空间，得到目标特征在固定维度的空间中的输出特征，再根据期望预测模型的逻辑回归函数中包含的权重系数及偏执系数计算输出特征对应的期望曝光时长。也即，可通过上述的式(2)计算得到输入的上述属于同一用户标识的推送信息样本的期望曝光时长。可计算该期望曝光时长与该属于同一用户标识的推送信息样本的实际曝光时长之间的误差值，并判断误差值是否满足精度条件。若不满足精度条件，则可根据误差值调整权重系数及偏执系数，还可调整各个全连接层的参数。

在一些实施例中，期望预测模型的每层全连接层可包括激活函数，在对期望预测模型进行训练时，每层全连接层可通过激活函数进行激活动，再利用Batch norm和Dropout等方式来加速网络收敛并控制过拟合风险。其中，Batch norm是一种在深度学习中通过对每一层全连接层的输出做标准化从而加快收敛，提高模型表现的技术。Drop out是一种在深度学习中通过随机去掉一层中的一些结点来控制过拟合的方法。激活函数可以是线性整流函数(Rectified Linear Unit，ReLU)等，但不限于此。全连接层也可通过其它算法加快收敛及控制过拟合，并不仅限于上述几种方式。

若期望预测模型输出的期望曝光时长与实际曝光时长之间的误差值不满足精度条件，则可继续通过属于同一用户标识的推送信息样本、应用行为数据、搜索行为数据及历史浏览记录对期望预测模型进行训练，直至期望预测模型输出的期望曝光时长与实际曝光时长之间的误差值满足精度条件。

步骤506，获取候选的目标推送信息、在一定时长内目标用户的行为数据，以及获取目标用户与目标推送信息关联的历史浏览记录。

步骤508，通过推送模型的特征提取模型分别提取目标推送信息的第一特征、应用行为数据的第二特征、搜索行为数据的第三特征，以及历史浏览记录的第四特征。

步骤510，将第一特征、第二特征、第三特征及第四特征进行拼接，得到目标特征。

步骤512，通过推送模型的期望预测模型对目标特征进行分析，得到预测的期望曝光时长。

步骤514，根据期望曝光时长确定目标用户对于目标推送信息的兴趣程度。

步骤506～514的描述可参照上述各实施例中的相关描述，在此不再一一赘述。

在本申请实施例中，通过将推送信息样本、用户在一定时长内的应用行为数据、用户在一定时长内的搜索行为数据，以及与推送信息样本关联的历史浏览记录四个方面作为推送模型的输入，并将推送信息样本的曝光时长作为目标对推送模型进行训练，使得训练后的推送模型能够准确预测用户对推送信息的期望曝光时长，可更加真实地反映目标用户对推送信息的兴趣，从而可以准确向用户推送用户感兴趣的信息，提高了信息推送的准确性，还可以避免信息推送不准确造成的资源浪费。

如图6所示，在一个实施例中，提供一种推送模型的训练方法，可应用于上述的电子设备，该方法可包括以下步骤：

步骤610，获取推送信息样本及与推送信息样本对应的用户历史数据，用户历史数据包括用户在一定时长内的应用行为数据、用户在一定时长内的搜索行为数据，以及包括与推送信息样本关联的历史浏览记录。

步骤620，根据推送信息样本和用户历史数据对推送模型进行训练，得到训练后的推送模型，训练后的推送模型预测的推送信息样本的期望曝光时长与推送信息样本的实际曝光时长之间的误差值满足精度条件。

如图7所示，在一个实施例中，步骤620包括步骤702～708。

步骤702，根据推送信息样本和用户历史数据对特征提取模型进行训练，得到训练后的特征提取模型。

在一个实施例中，特征提取模型包括相互独立的第一神经网络、第二神经网络及第三神经网络。步骤702可包括步骤(a)～(c)：

步骤(a)，根据推送信息样本序列对第一神经网络进行训练，将推送信息样本序列中包含的各个推送信息样本的信息标识映射到第一高维空间，得到推送信息样本序列中包含的每个推送信息的向量特征，以得到训练后的第一神经网络，训练后的第一神经网络用于提取推送信息样本的第一特征。

步骤(b)，根据应用行为数据生成应用使用序列，并根据应用使用序列对第二神经网络进行训练，将应用使用序列中包含的各个应用映射到第二高维空间，得到应用使用序列包含的每个应用的向量特征，以得到训练后的第二神经网络，训练后的第二神经网络用于提取应用行为数据的第二特征。

步骤(c)，根据搜索行为数据生成搜索词序列，并根据搜索词序列对第三神经网络进行训练，将搜索词序列中包含的各个搜索关键词映射到第三高维空间，得到搜索词序列中包含的每个搜索关键词的向量特征，以得到训练后的第三神经网络，训练后的第三神经网络用于提取搜索行为数据的第三特征。

步骤704，通过训练后的特征提取模型分别提取属于同一用户标识的推送信息样本的第一特征、属于同一用户标识的应用行为数据的第二特征、属于同一用户标识的搜索行为数据的第三特征，以及属于同一用户标识的历史浏览记录的第四特征。

步骤706，将第一特征、第二特征、第三特征及第四特征进行拼接，得到目标特征。

步骤708，将目标特征输入期望预测模型，并根据目标特征对期望预测模型进行训练。

在一个实施例中，步骤708，包括：通过期望预测模型的多个全连接层将目标特征映射到固定维度的空间，得到目标特征在固定维度的空间中的输出特征；根据期望预测模型的逻辑回归函数中包含的权重系数及偏执系数计算输出特征对应的期望曝光时长；计算期望曝光时长与属于同一用户标识的推送信息样本的实际曝光时长之间的误差值；若误差值不满足精度条件，则根据误差值调整权重系数及偏执系数，并重新执行步骤704～708，直至误差值满足精度条件。

本申请实施例中提供的推送模型的训练方法可参照上述实施例中提供的信息推送方法中的相关描述，在此不再一一赘述。

如图8所示，在一个实施例中，提供一种信息推送装置800，可应用于上述的电子设备。信息推送装置800可包括数据获取模块810、预测模块820及兴趣确定模块830。

数据获取模块810，用于获取候选的目标推送信息、在一定时长内目标用户的行为数据，以及获取目标用户与目标推送信息关联的历史浏览记录，其中，行为数据包括应用行为数据及搜索行为数据。

预测模块820，用于通过推送模型对目标推送信息、行为数据及历史浏览记录进行分析，得到推荐模型预测的期望曝光时长，其中，推送模型为通过推送信息样本以及与推送信息样本对应的用户历史数据训练得到的，用户历史数据包括用户在一定时长内的行为数据，以及包括与推送信息样本关联的历史浏览记录。

兴趣确定模块830，用于根据期望曝光时长确定目标用户对于目标推送信息的兴趣程度。

在一个实施例中，推送模型包括特征提取模型及期望预测模型。

预测模块820，包括特征提取单元、拼接单元及预测单元。

特征提取单元，用于通过特征提取模型分别提取目标推送信息的第一特征、应用行为数据的第二特征、搜索行为数据的第三特征，以及历史浏览记录的第四特征。

在一些实施例中，特征提取模型包括第一神经网络，第一神经网络是根据推送信息样本序列训练得到的，推送信息样本序列包括多个推送信息样本。

特征提取模型包括第一提取子单元，用于获取目标推送信息的信息标识并通过第一神经网络将信息标识映射到第一高维空间，得到目标推送信息的第一向量特征。

在一个实施例中，特征提取模型包括第二神经网络，第二神经网络是根据用户在一定时长内的应用行为数据训练得到的。

特征提取模型除了包括第一提取子单元，还包括第二提取子单元。

第二提取子单元，用于根据应用行为数据获取应用使用序列，应用使用序列包括目标用户在一定时长内，按照使用时刻的先后顺序依次排列的应用，并通过第二神经网络将应用使用序列中包含的各个应用映射到第二高维空间，得到应用使用序列中包含的每个应用的向量特征，再对每个应用的向量特征进行加权平均处理，得到应用行为数据的第二向量特征。

在一个实施例中，特征提取模型包括第三神经网络，第三神经网络是根据用户在一定时长内的搜索行为数据训练得到的。

特征提取模型除了包括第一提取子单元及二提取子单元，还包括第三提取子单元。

第三提取子单元，用于根据搜索行为数据获取搜索词序列，搜索词序列包括目标用户在一定时长内，按照搜索时间的先后顺序依次排列的搜索关键词，并通过第三神经网络将搜索词序列中包含的各个搜索关键词映射到第三高维空间，得到搜索词序列中包含的每个搜索关键词的向量特征，再对每个搜索关键词的向量特征进行加权平均处理，得到搜索行为数据的第三向量特征。

在一个实施例中，特征提取模型除了包括第一提取子单元、第二提取子单元及第三提取子单元，还包括第四提取子单元。

第四提取子单元，用于获取目标推送信息所属的信息类型，根据历史浏览记录获取最近浏览时刻距离当前时刻的第一时长，浏览时刻为目标用户最近一次浏览属于该信息类型的推送信息的时刻，并根据历史浏览记录获取第二时长，第二时长为目标用户浏览属于该信息类型的推送信息的历史最大时长，再分别对第一时长及第二时长进行非线性变化，得到非线性数值特征，并将第一时长、第二时长及非线性数值特征作为第四特征。

拼接单元，用于将第一特征、第二特征、第三特征及第四特征进行拼接，得到目标特征。

预测单元，用于通过期望预测模型对目标特征进行分析，得到预测的期望曝光时长。

在一个实施例中，预测单元，还用于通过期望预测模型的多个全连接层将目标特征映射到固定维度的空间，得到目标特征在固定维度的空间中的输出特征，根据期望预测模型的逻辑回归函数中包含的权重系数计算输出特征对应的期望曝光时长，逻辑回归函数中包含的权重系数与输出特征中包含的各个特征一一对应，期望曝光时长是通过以自然常数为底数，以输出特征及权重系数的加权和为对数计算得到的。

在一个实施例中，上述信息推送装置800，除了包括数据获取模块810、预测模块820及兴趣确定模块830，还包括训练模块。

训练模块，用于根据推送信息样本和用户历史数据对推送模型进行训练，用户历史数据包括用户在一定时长内的应用行为数据、用户在一定时长内的搜索行为数据，以及包括与推送信息样本关联的历史浏览记录。

在一个实施例中，训练模块包括输入单元、期望计算单元、误差计算单元及调整单元。

输入单元，用于将推送信息样本以及与推送信息样本对应的用户历史数据输入待训练的推送模型中。

期望计算单元，用于通过待训练的推送模型对输入的推送信息样本及用户历史数据进行分析，并根据推送模型的逻辑回归函数计算得到推送信息样本的期望曝光时长。

误差计算单元，用于计算推送信息样本的期望曝光时长与推送信息样本的实际曝光时长之间的误差值。

调整单元，用于若误差值不满足精度条件，则根据误差值调整推送模型的逻辑回归函数中包含的权重系数及偏执系数，并重新通过期望计算单元对输入的推送信息样本及用户历史数据进行分析，直至误差值满足精度条件。

在一个实施例中，训练模块除了包括输入单元、期望计算单元、误差计算单元及调整单元，还包括特征提取模型训练单元、特征提取单元、特征拼接单元。

特征提取模型训练单元，用于根据推送信息样本和用户历史数据对特征提取模型进行训练，得到训练后的特征提取模型。

特征提取单元，用于通过训练后的特征提取模型分别提取属于同一用户标识的推送信息样本的第一特征、属于同一用户标识的应用行为数据的第二特征、属于同一用户标识的搜索行为数据的第三特征，以及属于同一用户标识的历史浏览记录的第四特征。

特征拼接单元，用于将第一特征、第二特征、第三特征及第四特征进行拼接，得到目标特征。

期望计算单元，还用于通过期望预测模型的多个全连接层将目标特征映射到固定维度的空间，得到目标特征在固定维度的空间中的输出特征，并根据期望预测模型的逻辑回归函数中包含的权重系数及偏执系数计算输出特征对应的期望曝光时长。

误差计算单元，还用于计算期望曝光时长与该属于同一用户标识的推送信息样本的实际曝光时长之间的误差值。

调整单元，还用于若误差值不满足精度条件，则根据误差值调整权重系数及偏执系数，并重新通过特征提取单元及特征拼接单元得到目标特征，直至误差值满足精度条件。

如图9所示，在一个实施例中，提供一种推送模型的训练装置900，可应用于上述的电子设备。推送模型的训练装置900，包括样本获取模块910及训练模块920。

样本获取模块910，用于获取推送信息样本及与推送信息样本对应的用户历史数据，用户历史数据包括用户在一定时长内的应用行为数据、用户在一定时长内的搜索行为数据，以及包括与推送信息样本关联的历史浏览记录。

训练模块920，用于根据推送信息样本和用户历史数据对推送模型进行训练，得到训练后的推送模型，训练后的推送模型预测的推送信息样本的期望曝光时长与推送信息样本的实际曝光时长之间的误差值满足精度条件。

在一个实施例中，训练模块920，包括第一训练单元、特征提取单元、拼接单元及第二训练单元。

第一训练单元，用于根据推送信息样本和用户历史数据对特征提取模型进行训练，得到训练后的特征提取模型。

在一个实施例中，第一训练单元，包括第一训练子单元、第二训练子单元及第三训练子单元。

第一训练子单元，用于根据推送信息样本序列对第一神经网络进行训练，将推送信息样本序列中包含的各个推送信息样本的信息标识映射到第一高维空间，得到推送信息样本序列中包含的每个推送信息的向量特征，以得到训练后的第一神经网络，训练后的第一神经网络用于提取推送信息样本的第一特征。

第二训练子单元，用于根据应用行为数据生成应用使用序列，并根据应用使用序列对第二神经网络进行训练，将应用使用序列中包含的各个应用映射到第二高维空间，得到应用使用序列包含的每个应用的向量特征，以得到训练后的第二神经网络，训练后的第二神经网络用于提取应用行为数据的第二特征。

第三训练子单元，用于根据搜索行为数据生成搜索词序列，并根据搜索词序列对第三神经网络进行训练，将搜索词序列中包含的各个搜索关键词映射到第三高维空间，得到搜索词序列中包含的每个搜索关键词的向量特征，以得到训练后的第三神经网络，训练后的第三神经网络用于提取搜索行为数据的第三特征。

第二训练单元，用于将目标特征输入期望预测模型，并根据目标特征对期望预测模型进行训练。

在一个实施例中，第二训练单元，包括映射单元、期望计算单元、误差计算单元及调整单元。

映射单元，用于通过期望预测模型的多个全连接层将目标特征映射到固定维度的空间，得到目标特征在固定维度的空间中的输出特征。

期望计算单元，用于根据期望预测模型的逻辑回归函数中包含的权重系数及偏执系数计算输出特征对应的期望曝光时长。

误差计算单元，用于计算期望曝光时长与属于同一用户标识的推送信息样本的实际曝光时长之间的误差值。

调整单元，用于若误差值不满足精度条件，则根据误差值调整权重系数及偏执系数，并重新通过特征提取单元及拼接单元得到目标特征，直至误差值满足精度条件。

图10为一个实施例中电子设备的结构框图。电子设备可以是手机、平板电脑、智能穿戴设备、PC等终端设备，也可以是服务器。如图10所示，电子设备1000可以包括一个或多个如下部件：处理器1010、与处理器1010耦合的存储器1020，其中存储器1020可存储有一个或多个应用程序，一个或多个应用程序可以被配置为由一个或多个处理器1010执行，一个或多个程序配置用于执行如上述实施例描述的信息推送方法。

处理器1010可以包括一个或者多个处理核。处理器1010利用各种接口和线路连接整个电子设备1000内的各个部分，通过运行或执行存储在存储器1020内的指令、程序、代码集或指令集，以及调用存储在存储器1020内的数据，执行电子设备1000的各种功能和处理数据。可选地，处理器1010可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。处理器1010可集成中央处理器(Central Processing Unit，CPU)、图像处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器1010中，单独通过一块通信芯片进行实现。

存储器1020可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。存储器1020可用于存储指令、程序、代码、代码集或指令集。存储器1020可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等。存储数据区还可以存储电子设备1000在使用中所创建的数据等。

可以理解地，电子设备1000可包括比上述结构框图中更多或更少的结构元件，例如，包括电源、输入按键、摄像头、扬声器、屏幕、RF(Radio Frequency，射频)电路、Wi-Fi(Wireless Fidelity，无线保真)模块、蓝牙模块、传感器等，还可在此不进行限定。

本申请实施例公开一种计算机可读存储介质，其存储计算机程序，其中，该计算机程序被处理器执行时实现如上述实施例描述的信息推送方法。

本申请实施例公开一种计算机程序产品，该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，且该计算机程序可被处理器执行时实现如上述实施例描述的信息推送方法。

在一个实施例中，本申请实施例还提供一种电子设备，包括存储器及处理器，所述存储器中存储有计算机程序，该计算机程序被处理器执行时，使得所述处理器实现如上述实施例描述的推送模型的训练方法。

在一个实施例中，本申请实施例还提供一种计算机可读存储介质，其存储计算机程序，其中，该计算机程序被处理器执行时实现如上述实施例描述的推送模型的训练方法。

本申请实施例公开一种计算机程序产品，该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，且该计算机程序可被处理器执行时实现如上述实施例描述的推送模型的训练方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等。

如此处所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。合适的非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)，它用作外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定特征、结构或特性可以以任意适合的方式结合在一个或多个实施例中。本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在本申请的各种实施例中，应理解，上述各过程的序号的大小并不意味着执行顺序的必然先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物单元，即可位于一个地方，或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可获取的存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分，可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等，具体可以是计算机设备中的处理器)执行本申请的各个实施例上述方法的部分或全部步骤。

以上对本申请实施例公开的一种信息推送方法、装置、电子设备及计算机可读存储介质，以及公开的一种推送模型的训练方法、装置、电子设备及计算机可读存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种信息推送方法，其特征在于，包括：

获取候选的目标推送信息、在一定时长内目标用户的行为数据，以及获取所述目标用户与所述目标推送信息关联的历史浏览记录，其中，所述行为数据包括应用行为数据及搜索行为数据；

通过推送模型对所述目标推送信息、行为数据及历史浏览记录进行分析，得到所述推荐模型预测的期望曝光时长，其中，所述推送模型为通过推送信息样本以及与所述推送信息样本对应的用户历史数据训练得到的，所述用户历史数据包括用户在一定时长内的行为数据，以及包括与所述推送信息样本关联的历史浏览记录；

根据所述期望曝光时长确定所述目标用户对于所述目标推送信息的兴趣程度。

2.根据权利要求1所述的方法，其特征在于，所述推送模型包括特征提取模型及期望预测模型；

所述通过推送模型对所述目标推送信息、行为数据及历史浏览记录进行分析，得到所述推荐模型预测的期望曝光时长，包括：

通过所述特征提取模型分别提取所述目标推送信息的第一特征、所述应用行为数据的第二特征、所述搜索行为数据的第三特征，以及所述历史浏览记录的第四特征；

将所述第一特征、第二特征、第三特征及第四特征进行拼接，得到目标特征；

通过所述期望预测模型对所述目标特征进行分析，得到预测的期望曝光时长。

3.根据权利要求2所述的方法，其特征在于，所述特征提取模型包括第一神经网络，所述第一神经网络是根据推送信息样本序列训练得到的，所述推送信息样本序列包括多个推送信息样本；

通过所述特征提取模型提取所述目标推送信息的第一特征，包括：

获取所述目标推送信息的信息标识；

通过所述第一神经网络将所述信息标识映射到第一高维空间，得到所述目标推送信息的第一向量特征。

4.根据权利要求2所述的方法，其特征在于，所述特征提取模型包括第二神经网络，所述第二神经网络是根据用户在一定时长内的应用行为数据训练得到的；

通过所述特征提取模型提取所述应用行为数据的第二特征，包括：

根据所述应用行为数据获取应用使用序列，所述应用使用序列包括所述目标用户在所述一定时长内，按照使用时刻的先后顺序依次排列的应用；

通过所述第二神经网络将所述应用使用序列中包含的各个应用映射到第二高维空间，得到所述应用使用序列中包含的每个应用的向量特征；

对所述每个应用的向量特征进行加权平均处理，得到所述应用行为数据的第二向量特征。

5.根据权利要求2所述的方法，其特征在于，所述特征提取模型包括第三神经网络，所述第三神经网络是根据用户在一定时长内的搜索行为数据训练得到的；

通过所述特征提取模型提取所述搜索行为数据的第三特征，包括：

根据所述搜索行为数据获取搜索词序列，所述搜索词序列包括所述目标用户在所述一定时长内，按照搜索时间的先后顺序依次排列的搜索关键词；

通过所述第三神经网络将所述搜索词序列中包含的各个搜索关键词映射到第三高维空间，得到所述搜索词序列中包含的每个搜索关键词的向量特征；

对所述每个搜索关键词的向量特征进行加权平均处理，得到所述搜索行为数据的第三向量特征。

6.根据权利要求2所述的方法，其特征在于，通过所述特征提取模型提取所述历史浏览记录的第四特征，包括：

获取所述目标推送信息所属的信息类型；

根据所述历史浏览记录获取最近浏览时刻距离当前时刻的第一时长，所述浏览时刻为所述目标用户最近一次浏览属于所述信息类型的推送信息的时刻；

根据所述历史浏览记录获取第二时长，所述第二时长为所述目标用户浏览属于所述信息类型的推送信息的历史最大时长；

分别对所述第一时长及第二时长进行非线性变化，得到非线性数值特征，并将所述第一时长、第二时长及非线性数值特征作为第四特征。

7.根据权利要求2至6任一所述的方法，其特征在于，所述通过所述期望预测模型对所述目标特征进行分析，得到预测的期望曝光时长，包括：

通过所述期望预测模型的多个全连接层将所述目标特征映射到固定维度的空间，得到所述目标特征在所述固定维度的空间中的输出特征；

根据所述期望预测模型的逻辑回归函数中包含的权重系数计算所述输出特征对应的期望曝光时长，所述逻辑回归函数中包含的权重系数与所述输出特征中包含的各个特征一一对应，所述期望曝光时长是通过以自然常数为底数，以所述输出特征及权重系数的加权和为对数计算得到的。

8.根据权利要求7所述的方法，其特征在于，所述推送模型的训练方式包括：

将所述推送信息样本以及与所述推送信息样本对应的用户历史数据输入待训练的推送模型中；

通过所述待训练的推送模型对输入的推送信息样本及用户历史数据进行分析，并根据所述推送模型的逻辑回归函数计算得到所述推送信息样本的期望曝光时长；

计算所述推送信息样本的期望曝光时长与所述推送信息样本的实际曝光时长之间的误差值；

若所述误差值不满足精度条件，则根据所述误差值调整所述推送模型的逻辑回归函数中包含的权重系数及偏执系数，并重新执行所述通过所述待训练的推送模型对输入的推送信息样本及用户历史数据进行分析的步骤，直至所述误差值满足所述精度条件。

9.一种推送模型的训练方法，其特征在于，包括：

获取推送信息样本及与所述推送信息样本对应的用户历史数据，所述用户历史数据包括用户在一定时长内的应用行为数据、用户在所述一定时长内的搜索行为数据，以及包括与所述推送信息样本关联的历史浏览记录；

根据所述推送信息样本和用户历史数据对推送模型进行训练，得到训练后的推送模型，所述训练后的推送模型预测的所述推送信息样本的期望曝光时长与所述推送信息样本的实际曝光时长之间的误差值满足精度条件。

10.根据权利要求9所述的方法，其特征在于，所述推送模型包括特征提取模型及期望预测模型，所述根据所述推送信息样本和用户历史数据对推送模型进行训练，包括：

根据所述推送信息样本和用户历史数据对所述特征提取模型进行训练，得到训练后的特征提取模型；

通过所述训练后的特征提取模型分别提取属于同一用户标识的推送信息样本的第一特征、属于所述同一用户标识的应用行为数据的第二特征、属于所述同一用户标识的搜索行为数据的第三特征，以及属于所述同一用户标识的历史浏览记录的第四特征；

将所述目标特征输入所述期望预测模型，并根据目标特征对所述期望预测模型进行训练。

11.根据权利要求10所述的方法，其特征在于，所述特征提取模型包括相互独立的第一神经网络、第二神经网络及第三神经网络；

所述根据所述推送信息样本和用户历史数据对所述特征提取模型进行训练，得到训练后的特征提取模型，包括：

根据推送信息样本序列对所述第一神经网络进行训练，将所述推送信息样本序列中包含的各个推送信息样本的信息标识映射到第一高维空间，得到所述推送信息样本序列中包含的每个推送信息的向量特征，以得到训练后的第一神经网络，所述训练后的第一神经网络用于提取推送信息样本的第一特征；

根据所述应用行为数据生成应用使用序列，并根据所述应用使用序列对所述第二神经网络进行训练，将所述应用使用序列中包含的各个应用映射到第二高维空间，得到所述应用使用序列包含的每个应用的向量特征，以得到训练后的第二神经网络，所述训练后的第二神经网络用于提取应用行为数据的第二特征；

根据搜索行为数据生成搜索词序列，并根据所述搜索词序列对所述第三神经网络进行训练，将所述搜索词序列中包含的各个搜索关键词映射到第三高维空间，得到所述搜索词序列中包含的每个搜索关键词的向量特征，以得到训练后的第三神经网络，所述训练后的第三神经网络用于提取搜索行为数据的第三特征。

12.根据权利要求10或11所述的方法，其特征在于，所述将所述目标特征输入所述期望预测模型，并根据目标特征对所述期望预测模型进行训练，包括：

根据所述期望预测模型的逻辑回归函数中包含的权重系数及偏执系数计算所述输出特征对应的期望曝光时长；

计算所述期望曝光时长与所述属于同一用户标识的推送信息样本的实际曝光时长之间的误差值；

若所述误差值不满足精度条件，则根据所述误差值调整所述权重系数及偏执系数，并重新通过所述训练后的特征提取模型分别提取属于同一用户标识的推送信息样本的第一特征、属于所述同一用户标识的应用行为数据的第二特征、属于所述同一用户标识的搜索行为数据的第三特征，以及属于所述同一用户标识的历史浏览记录的第四特征的步骤，直至所述误差值满足所述精度条件。

13.一种信息推送装置，其特征在于，包括：

数据获取模块，用于获取候选的目标推送信息、在一定时长内目标用户的行为数据，以及获取所述目标用户与所述目标推送信息关联的历史浏览记录，其中，所述行为数据包括应用行为数据及搜索行为数据；

预测模块，用于通过推送模型对所述目标推送信息、行为数据及历史浏览记录进行分析，得到所述推荐模型预测的期望曝光时长，其中，所述推送模型为通过推送信息样本以及与所述推送信息样本对应的用户历史数据训练得到的，所述用户历史数据包括用户在一定时长内的行为数据，以及包括与所述推送信息样本关联的历史浏览记录；

兴趣确定模块，用于根据所述期望曝光时长确定所述目标用户对于所述目标推送信息的兴趣程度。

14.一种推送模型的训练装置，其特征在于，包括：

样本获取模块，用于获取推送信息样本及与所述推送信息样本对应的用户历史数据，所述用户历史数据包括用户在一定时长内的应用行为数据、用户在所述一定时长内的搜索行为数据，以及包括与所述推送信息样本关联的历史浏览记录；

训练模块，用于根据所述推送信息样本和用户历史数据对推送模型进行训练，得到训练后的推送模型，所述训练后的推送模型预测的所述推送信息样本的期望曝光时长与所述推送信息样本的实际曝光时长之间的误差值满足精度条件。

15.一种电子设备，其特征在于，包括存储器及处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器实现如权利要求1至8任一所述的方法。

16.一种电子设备，其特征在于，包括存储器及处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器实现如权利要求9至12任一所述的方法。

17.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至8任一所述的方法。

18.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求9至12任一所述的方法。